在庞大的中枢区域文字转WAV音频