他要仔细观察三人的表情文字转WAV音频