他把更多的注意力放在了照片上文字转WAV音频