首先是他肯定无法做到跟随身带着块硬盘一样记得那么精确无差文字转WAV音频