重新组织了一遍语言文字转WAV音频