并且复位也要复杂的多文字转WAV音频