然后剩下的能量重新规整文字转WAV音频