因为他们是使用者文字转WAV音频