因为她完全可以通过声音来辨别他们现在正在做的动作……文字转WAV音频