这个方案我原则上同意了文字转WAV音频