然后将他们说过的话文字转WAV音频