所以她给出了模拟两口的答案文字转WAV音频