都几乎捕捉不了文字转WAV音频