用的就是先前拍得那张文字转WAV音频