我倒是觉得他们倒是文字转WAV音频