斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景

历史背景

视觉处理是始于视觉世界的简单结构，面向边缘，沿着视觉处理途径的移动，信息也在变化，大脑建立了复杂的视觉信息，直到可以识别更为复杂的视觉世界
1.block world
视觉世界被简化为简单的几何形状，目的是识别重建他们
50年发展，计算机视觉领域已经成为人工智能最重要和发展最快的领域之一
2.David Marr
问题：如何理解视觉，如何处理计算机视觉，开发，甚至如何可以使计算机识别视觉世界的算法
斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景

为了拍摄一幅图像并获得视觉世界的最终全面的3D表现，我们需要经历：
原始草图
大部分边缘，端点，虚拟线条，曲线，边界都被其它元素来表示
2.5维草图
开始将表面，深度信息层或视觉场景的不连续性拼凑一起
3d模型
最后将所有内容放在一起，在表面和体积图等分层组织了一个3d模型
3.问题：如何越过简单的块状世界，开始识别或表示现实世界，即如何识别和标识对象
斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景

方法：将物体的复杂结构简约成一个集合体，有更简单的形状和几何结构
4.david lowe思考问题
如何重建或者识别简单的物体结构组成的视觉空间
方法：边缘和直线
5.重要问题：
目标识别很难，呢么首先进行目标分割
目标分割：把一张图片中的像素点归类到有意义的区域
例如，把属于人的像素点从背景中扣出来，就是图像分割
面部检测
一些模型：支持向量机，boosting方法，图模型
6.如何做到更好的目标识别
基于特征的目标识别
（1) 首要任务，在目标上确认这些关键特征，将特征与相似目标进行匹配，这比匹配整个目标要容易
(2) 斯坦福李飞飞CS231n笔记1计算机视觉概述与历史背景
进展：识别整幅图的场景，例如空间金字塔匹配
（3）
其中一个工作，方向梯度直方图和科比啊逆行部件模型