显然他们的猜测是不对的文字转WAV音频