第一次是为了拍摄文字转WAV音频