他们现在要做的就是要听上面的文字转WAV音频