哪怕环境也要计算到里面文字转WAV音频