综述

算是笔记吧!计算机视觉主要任务划分:

  • Semantic segmentation是pixel oriented。也就是面向像素的,事实上这种训练数据需要在每一个pixel上提供label。
  • Classification+Localization 识别单个物品并且识别位置(E.g, draw box)
  • Object Detection容易与前者混淆,事实上Object Detection是一个有挑战性的任务。因为对于每一个input你的DNN输出的结果数目都是不确定的。你要去“识别”——找到哪些可能是objects。一种研究思路是首先使用tranditional tech 来做region proposal基于region proposal再进行classification。RCNN/fast-RCNN/Faster-RCNN都面向该任务。
  • Instance Segmentation 在你找到objects之后不是画box而是面向pixel进行分割。Mask-RCNN面向该任务,甚至可以提供pose的计算。而Mask-RCNN的作者就是大名鼎鼎的Kaiming He。

DL-semantic segmentation/Classification+Localization/Object Detection/Instance Segmentation
来源:cs231n

相关文章:

  • 2021-04-30
  • 2021-07-20
  • 2021-08-23
  • 2021-10-28
  • 2022-01-06
  • 2021-06-10
  • 2021-09-09
猜你喜欢
  • 2021-11-22
  • 2021-03-28
  • 2021-06-14
  • 2021-05-31
  • 2022-01-19
  • 2021-09-02
相关资源
相似解决方案