用了不到五分钟的时间分析整个事件的关键文字转WAV音频