他需要一个安定的环境文字转WAV音频