在事后统计出来的数据是文字转WAV音频