受到的控制也似乎弱了文字转WAV音频