不过他相信他们了解的肯定只是局限于其中一小部分文字转WAV音频