计算机视觉简介

douer · 发表于 2015-11-27 15:28:33

首先需要回答的一个问题是什么是计算机视觉。正像很多学科一样，很多人在从事这方面的研究，但又很少有人能给出一个严格的定义。人工智能是这样，虚拟现实是这样，计算视觉也是不例外。

最直观地讲，所谓计算机视觉就是用计算机来模拟人的视觉系统，实现人的视觉功能。马上随之而来的另一个问题是：人类视觉的主要功能是什么？或者更一般地讲，人类视觉系统主要是干什么的？我们人人有两只眼，眼的用处是看东西。我们无时不刻在用眼看东西，但我们主要在看什么？看的目的是什么？或者说为什么要看？似乎这些问题简单得很少有人去思考，但事实上又很少有人能说清楚。

人与其它动物一样，视觉、听觉、触觉等感官功能的产生，首先在于进化过程中生存的需要。根据美国心理学家Gibson的理论，人的视觉不管有多少用处，但主要功能可概括为适应外界环境和控制自身的运动。看到汽车冲过来，你会赶快回避；看到前面有激流，你不会冒然趟过去。“适应外界环境和控制自身的运动”还是比较抽象的概念。事实上，为了适应外界环境和控制自身的运动，我们的视觉系统需要：能识别物体（可想而知，一个人连亲戚、同事、朋友都不认识，会怎样生活），能判断物体的运动以及确定物体的形状和方位（否则，无法抓取物体）。所以，物体识别、物体定位、物体三维形状恢复和运动分析，就构成了计算机视觉的主要研究内容。

粗略地讲，计算机视觉经历了以下4个主要发展历程：

1：马尔视觉计算理论．1982年马尔视觉计算理论的提出【1】，标志着计算机视觉成为了一门独立的学科。马尔视觉计算理论包含二个主要观点：首先，马尔认为人类视觉的主要功能是复原三维场景的可见几何表面，即三维重建问题；其次，马尔认为这种从二维图像到三维几何结构的复原过程是可以通过计算完成的，并提出了从图像初始略图（sketch）物体2.5维描述—>物体3维描述一套完整的计算理论和方法。

2：主动视觉，目的视觉。针对马尔理论在具体应用中遇到的困难，以 Aloimonos【4】，Bajcsy等为代表的学者在上世纪八十年代末、九十年代初提出了“目的视觉”、“主动视觉”、“定性视觉”等理论。这些理论的共同特点是认为马尔理论自下到上的三维重建过程，由于缺乏目的性、缺乏高层知识反馈，从而导致三维重建框架不可行，重建算法不鲁棒。他们强调视觉算法高层知识反馈的必要性和重要性，以及视觉主体与环境交互的重要性。这些理论尽管从原理上来说更加符合人类视觉过程，但由于“利用什么样的高层知识”，“如何利用高层知识”，“视觉主体如何与环境进行有效交互”等这些核心问题目前人们还知之甚少，在近期内估计还很难建立有效的计算模型，所以这些理论自从1994 年众多知名学者在CVGIP：Image Understanding上组织关于主动视觉的大辩论后，这些理论至今仍没有显著性进展。

3：分层重建理论 (Stratified Reconstruction). 以Faugeras 和Hartley 【5】等提出的分层重建理论是上世纪90年代计算机视觉领域最活跃的研究内容。分层重建的基本思想是指从图像到三维欧几里得空间的重建过程中，先从图像空间得到射影空间下的重建（11个未知数），然后将射影空间下重建的结果提升到仿射空间（3个未知数），最后将仿射空间下重建的结果提升到欧几里得空间（5个未知数）。这种分层重建方法由于每一步重建过程中涉及到的未知变量少，几何意义明确，所以算法的鲁棒性得到了有效提高。例如Google和Microsoft公司开发的基于地面图像的3D地图系统Google Earth和Bing Map，Nokia公司开发的基于航空图像的3D城市C3 Ovi Map，NASA开发的开源系统World Wind等等，其中的核心技术之一就是基于分层重建的从运动恢复结构的技术（SFM）。

4：基于学习的视觉。物体识别是计算机视觉的重要研究内容。随着基于图像的物体表达的提出【2】和机器学习的进展【6】，基于学习的视觉是近年来计算机视觉的研究热点。所谓基于学习的视觉，就是指利用机器学习的手段来对图像物体进行识别的方法，包括对物体个体的识别（object identification）和对物体类别的分类（object categorization）。

另外，视觉伺服、大场景三维重建、海量图像标注、特定领域视频分析、视觉监控都是近年来计算机视觉领域非常活跃的研究方向。

计算机视觉有三大主要国际会议，包括两年一次的国际计算机视觉会议（ICCV）和欧洲计算机视觉会议（ECCV）以及一年一次的计算机视觉和模式识别会议（CVPR）。计算机视觉最著名的奖是每次ICCV会议上授予的马尔奖（Marr Prize）。最主要的刊物有：IEEE T-PAMI ( IEEE Transactions on Pattern Analysis and Machine Intelligence) 和IJCV（International Journal of Computer Vision）

更多详情了解请登录科美视觉网站进行案列了解网址：http://clearmediatech.com

帐号		自动登录	找回密码
密码			注册

LabVIEW+单片机学习套件全套教程资料下载[免费]	LabVIEW论坛精华列表贴	USB0816数据采集卡	《LabVIEW宝典》
LabWindows/CVI论坛精华贴	NET0816以太网数据采集卡	RC0210远程设备授权系统关闭关停	锁定打开设备户外分布式数据采集
NET1624低速高精度以太网数据采集卡	WIFI0824SD无线WIFI网络数据采集卡	脱机运行 SD存储小尺寸微型串口采集	远程采集安卓手持移动采集纪录仪

计算机视觉简介

浏览过的版块