因为他们意识到了文字转WAV音频