【发布时间】:2022-01-08 22:54:35
【问题描述】:
关于我的目标检测yolov5 训练过程,我需要您的帮助!
我尝试训练我的物体检测模型 yolov5 来检测小物体(从头开始)。为了标记我的图像,我使用了 roboflow,我应用了一些数据增强和一些 roboflow 作为服务提供的预处理。当我完成预处理步骤并且数据增强 roboflow 提供了不同输出格式的选择时,在我的情况下它是 yolov5 pytorch,并且 roboflow 为我将数据拆分为训练验证和测试。因此,一切都按照我的数据准备进行了设置,最后我得到了带有 data.yaml 的文件夹和带有标签的图像,在 data.yaml 中,我把我看到的训练和验证集的路径在 yolov5 的 GitHub 教程中。 我非常仔细地按照步骤进行操作。
问题是当训练开始时,我在 obj 和 box 列中得到 nan,如下图所示,我不知道原因,有人能与此相关吗或者请给我任何线索以找到解决方案,这是我在计算机视觉领域的第一个项目。
This is what i get when the training process starts
This the last message error when the training finish
训练继续进行,没有任何问题,但地图和精度在整个过程中保持为 0!!
Ps:这是我关注的tuto链接:https://github.com/ultralytics/yolov5/wiki/Train-Custom-Data
【问题讨论】:
-
这就是我要解决的问题。 - 在 collab 上运行您的代码,因为环境被证明运行良好 - 确认您的标签看起来不错并且设置正确。您可以检查以确保课程看起来正确吗?在其中一张屏幕截图中,您似乎没有标签。
-
非常感谢@alexheat 的回答!我将按照您的建议在 colab 中测试我的代码,并让您知道它是否工作正常。关于标签,我检查了他们的设置并进行了一些可视化,显示盒子应该是这样并且看起来很好,对于我只有一个类的类,该类的标签是 0,因为 yolov5 从一个标签的 0 开始,如果有第二个标签,则第二个标签为 1。
-
我不知道这是否与我的问题有关(在我的模型代码实现中的某个地方除以 0 作为示例,因为我自己没有编写代码,所以我采用了 yolov5 的代码,因为它是如此我不知道代码里面的步骤和操作)。