首先他在之前的数据分析了筛选出集中最经常出现的情况文字转WAV音频