首先要经过一片中间的过渡地带文字转WAV音频