五六个人一遍又一遍的仔细的比对着监控录像的每个镜头文字转WAV音频