释放之前和释放之后的过程并没有明显区分文字转WAV音频