控制了肉身文字转WAV音频