根本目的就是看事件的真实情况…在没有读心术和记忆回放的前提下文字转WAV音频