而且他以一个医生的角度推测文字转WAV音频