事实上…我们一开始就有怀疑文字转WAV音频