估计也是在留意外面的动静文字转WAV音频