因此他也无法说出最大的不同在哪里文字转WAV音频