最后肯定是需要重建的文字转WAV音频