1-02 计算机视觉
目录
- 1 什么是CV
- 2 深度学习与CV
- 3 CV的应用
- 4 CV技能树构建
1 什么是CV
定义:就是让计算机拥有人能所见、人能所识、人能所思的能力,就可以称计算机拥有视觉,即计算机视觉。
让机器 看到,并且 认识、理解 所看到的东西,进而可以 预测
- 图像识别也包括视频、实时
2 深度学习与CV
基于深度学习的计算机视觉
识别图片-> 需要人工智能-> 选择机器学习(传统人工智能不适用)-> 深度学习(传统机器学习不适用)
深度学习好用!
3 CV的应用 - 五大应用
3.1 图像分类
图像分类架构–卷积神经网络(CNN)
- 线性整流层–RELU
- 池化层-pool
3.2 目标检测
定义:在一张图中找到所有可能的物体,并且匡出来,告诉你该物体是什么
- 位置
- 大小
- 分类
目标检测–R-CNN
[例]
自动驾驶、工业质检、电子元器件缺陷检测都是通过目标检测实现的
3.3 目标跟踪
[例]
安防摄像头:
- 可以追踪一个人的轨迹;
- 并且跟踪人不同的部位(人脸识别、检测乱扔垃圾)
3.4 语义分割
定义:将捕捉到的视频,内容按语义分割成不同的语义和区块
语义分割–FCN
[例] 自动驾驶
3.5 实例分割
定义:把每个个体都分割开来(不同人不同颜色)
实例分割–Mask R-CNN
[例] 安防摄像头、工业质检(解析图)
其他
• 安防
• 交通
• 工业生产
• 在线购物
• 信息检索
• 游戏娱乐
• 摄影摄像
• 机器人/无人机
• 体育
• 医疗
4 CV技能树构建
来源于八斗学院