第三轮必须要进行文字转WAV音频