因为他们已经料定了文字转WAV音频