分为三个区域文字转WAV音频