实际上是给他一次机会文字转WAV音频