这也是他提前算计好的文字转WAV音频