他们在回答问题的时候文字转WAV音频