所以不可能保持和下去之前一模一样的声音文字转WAV音频