还是需要培养一下他们的文字转WAV音频