拍摄过程并不容易文字转WAV音频