如何为高类内变化设置适当的模型设置和层答案

【问题标题】：how to set up the appropriate model setting and layers for high intra-class variation如何为高类内变化设置适当的模型设置和层
【发布时间】：2017-06-16 10:22:26
【问题描述】：

所有专家

我是 CNN 和 Caffe 的新手。我有一个在 2 个类之间进行分类的任务。我收集的数据集非常小，A 类大约 50 个，B 类大约 50 个（我知道它非常非常小）。它是一个人的图像。我采用了 BVLC 模型并进行了更改，例如用于测试和训练的批量大小以及最大迭代。我尝试了许多不同的设置，但模型不起作用。关于如何提出适当的模型或设置或其他解决方案的任何想法？

remark** 我曾经对 BVLC 模型设置进行了一次随机更改，并且成功了，但是我丢失了设置文件。

对于 train.prototxt 和 Solve.prototxt，我是从这个人 Adil Moujahid

那里得到的

我确实尝试将批量大小训练为 32,64,128,256 并测试 5,20,30 但失败了

对于数据集，是普通女性和美女的图片，我会分类，但是Stackoverflow不允许我添加超过2个链接

我想知道我能想出任何公式、方程式或步骤并选择正确的模型设置。

提前谢谢你。

【问题讨论】：

您的问题含糊不清。您需要更具体并提供更多信息。你用的是什么网络？提供您的 train.prototxt 和 solver.prototxt 文件。您还应该在终端上提供训练输出的屏幕截图。
谢谢你的回答，我已经添加了我的train和text.prototxt的来源

标签： caffe conv-neural-network

【解决方案1】：

“不起作用”是什么意思？损失太高？训练收敛，但准确率低？ Andrew Ng 有一场关于“调试”CNN 的精彩会议——使用深度学习构建应用程序的基本要素（NIPS slides、summary、additional summary）。

我的猜测是您的网络存在过拟合问题 - 它学习特定示例并且无法泛化 - 因此增加训练数据集/正则化/数据增强会有所帮助。

【讨论】：