【发布时间】:2021-08-27 16:01:17
【问题描述】:
我想检测比只检测 80 个对象的 coco 数据集更多的对象,我想检测尽可能多的动作,比如拥抱、游泳……等等。
我不关心大小,我确实不想训练自己...那么是否有足够大的数据集(权重)可供我使用可以下载和使用还是我必须为 yolo 训练和标记?
【问题讨论】:
标签: computer-vision object-detection yolo yolov4
我想检测比只检测 80 个对象的 coco 数据集更多的对象,我想检测尽可能多的动作,比如拥抱、游泳……等等。
我不关心大小,我确实不想训练自己...那么是否有足够大的数据集(权重)可供我使用可以下载和使用还是我必须为 yolo 训练和标记?
【问题讨论】:
标签: computer-vision object-detection yolo yolov4
您尝试分类的内容表示为动作识别。这里 [1] 是一个很好的存储库,其中列出了许多用于此任务的开箱即用模型。
解释:模型(如 YOLO)包含两个主要模块:特征提取(CNN 的东西)和分类(线性层)。从头开始训练时,特征提取和分类都将从头开始训练。将分类训练到你想要的很容易,但很难训练特征提取部分(因为它需要很多时间)。因此,我们通常在泛化数据集上使用预训练模型(例如在 COCO 上训练 YOLO),因此我们的特征提取部分从一个比较好的泛化位置开始。稍后,我们将自己的分类部分替换为我们的任务从头开始训练。
TL;DR,您可以在 COCO 上使用预训练的 YOLO 模型来完成您的任务,方法是替换最后的线性层来分类您想要的内容。以下是不同框架的一些资源 [2, 3]。
此处 [4] 是如何执行此操作的简单演练。
【讨论】:
您可以找到here 一个非常庞大的带有边界框的数据集!
【讨论】: