他完全可以先不说出来文字转WAV音频