在大多数情况下都是这样的……他们不会像人类那样为了所谓的文字转WAV音频