所以考虑第二批去文字转WAV音频