内层就是各种的功能区文字转WAV音频