他认为自己不会输文字转WAV音频