他用大部分的时间在入定文字转WAV音频