所以管理和抓捕文字转WAV音频