结果得到的自然是眼角和鼻孔文字转WAV音频