另外三个则继续把守着文字转WAV音频