但从他们刚才互相谈话的表情上来判断文字转WAV音频