从最开始就已经注定了要输文字转WAV音频