它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的各种信息。更具体的讲,就是指用摄影头和电脑等代替人眼对目标进行识别、检测、跟踪和测量等机器视觉,并进一步做图形处理。
作为一个学科,计算机视觉希望通过研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。
计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。它是一门综合性的学科,其包含计算机科学和工程、信号处理、应用数学和统计学,神经生理学和认知科学等领域的内容。计算机视觉领域的突出特点是其多样性与不完善性。
这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。在20世纪90年代,一方面由于CPU、DSP等图像处理硬件技术有了飞速进步;另一方面人们提出了更高性能的算法,其中包括统计方法和局部特征描述符的引入,使得计算机视觉技术取得了更大的发展,并开始广泛应用于工业领域。
进入21世纪,得益于互联网兴起和数码相机出现带来的海量数据,加之机器学习方法的广泛应用,计算机视觉发展迅速。特别是2010年后,借助于深度学习计算机视觉技术得到了爆发增长和产业化,通过深度神经网络各类视觉相关任务的识别精度都得到了大幅提升。以往许多基于规则的处理方式都被计算机视觉算法所替代,自动从海量数据中总结归纳物体的特征,然后进行识别和判断。这一阶越来越多的应用趋于成熟,包括人脸识别、行人检测、自动驾驶等。随着计算机视觉的不断发展,基于计算机视觉的智能视频监控和身份识别等市场逐渐成熟扩大,机器视觉的技术和应用趋于成熟,广泛应用于制造、安检、图像检索、医疗影像分析、人机交互等领域。