就是将激发人的文字转WAV音频