此时他们已经断定文字转WAV音频