似乎他只是提出了一个正常不过的建议文字转WAV音频