所有的消息都是通过别人的嘴巴传达的文字转WAV音频