其余的三个人都听懂了文字转WAV音频