通过拍摄的镜头文字转WAV音频