历史背景

视觉处理是始于视觉世界的简单结构,面向边缘,沿着视觉处理途径的移动,信息也在变化,大脑建立了复杂的视觉信息,直到可以识别更为复杂的视觉世界
1.block world
视觉世界被简化为简单的几何形状,目的是识别重建他们
50年发展,计算机视觉领域已经成为人工智能最重要和发展最快的领域之一
2.David Marr
问题:如何理解视觉,如何处理计算机视觉,开发,甚至如何可以使计算机识别视觉世界的算法
斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景

为了拍摄一幅图像并获得视觉世界的最终全面的3D表现,我们需要经历:
原始草图
大部分边缘,端点,虚拟线条,曲线,边界都被其它元素来表示
2.5维草图
开始将表面,深度信息层或视觉场景的不连续性拼凑一起
3d模型
最后将所有内容放在一起,在表面和体积图等分层组织了一个3d模型
3.问题:如何越过简单的块状世界,开始识别或表示现实世界,即如何识别和标识对象
斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景

方法:将物体的复杂结构简约成一个集合体,有更简单的形状和几何结构
4.david lowe思考问题
如何重建或者识别简单的物体结构组成的视觉空间
方法:边缘和直线
5.重要问题:
目标识别很难,呢么首先进行目标分割
目标分割:把一张图片中的像素点归类到有意义的区域
例如,把属于人的像素点从背景中扣出来,就是图像分割
面部检测
一些模型:支持向量机,boosting方法,图模型
6.如何做到更好的目标识别
基于特征的目标识别
(1) 首要任务,在目标上确认这些关键特征,将特征与相似目标进行匹配,这比匹配整个目标要容易
(2)斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景
进展:识别整幅图的场景,例如空间金字塔匹配
(3)斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景
其中一个工作,方向梯度直方图和科比啊逆行部件模型

相关文章: