【问题标题】:how to set up the appropriate model setting and layers for high intra-class variation如何为高类内变化设置适当的模型设置和层
【发布时间】:2017-06-16 10:22:26
【问题描述】:

所有专家

我是 CNN 和 Caffe 的新手。我有一个在 2 个类之间进行分类的任务。我收集的数据集非常小,A 类大约 50 个,B 类大约 50 个(我知道它非常非常小)。它是一个人的图像。 我采用了 BVLC 模型并进行了更改,例如用于测试和训练的批量大小以及最大迭代。我尝试了许多不同的设置,但模型不起作用。 关于如何提出适当的模型或设置或其他解决方案的任何想法?

remark** 我曾经对 BVLC 模型设置进行了一次随机更改,并且成功了,但是我丢失了设置文件。

对于 train.prototxtSolve.prototxt,我是从这个人 Adil Moujahid

那里得到的

我确实尝试将批量大小训练为 32,64,128,256 并测试 5,20,30 但失败了

对于数据集,是普通女性和美女的图片,我会分类,但是Stackoverflow不允许我添加超过2个链接

我想知道我能想出任何公式、方程式或步骤并选择正确的模型设置。

提前谢谢你。

【问题讨论】:

  • 您的问题含糊不清。您需要更具体并提供更多信息。你用的是什么网络?提供您的 train.prototxtsolver.prototxt 文件。您还应该在终端上提供训练输出的屏幕截图。
  • 谢谢你的回答,我已经添加了我的train和text.prototxt的来源

标签: caffe conv-neural-network


【解决方案1】:

“不起作用”是什么意思?损失太高?训练收敛,但准确率低? Andrew Ng 有一场关于“调试”CNN 的精彩会议——使用深度学习构建应用程序的基本要素(NIPS slidessummaryadditional summary)。

我的猜测是您的网络存在过拟合问题 - 它学习特定示例并且无法泛化 - 因此增加训练数据集/正则化/数据增强会有所帮助。

【讨论】:

    猜你喜欢
    • 2019-02-20
    • 2021-12-08
    • 2017-12-01
    • 2016-09-28
    • 2022-06-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多