我们还是需要他们的文字转WAV音频