起码能从对方的言行举止文字转WAV音频