因为他们不会计算文字转WAV音频