这种模式很难说清楚利弊文字转WAV音频