最关键是他第一阶段测试中完全没有出现文字转WAV音频