他也无法准确地说出文字转WAV音频