更在于他可以根据极少量甚至是只言片语的信息碎片文字转WAV音频