一共进行了三次确认文字转WAV音频