他们可能是非常了解我们的文字转WAV音频