分析的都是总引用数文字转WAV音频