确实已经完全脱离了文字转WAV音频