【问题标题】:Is it okay to have a higher dev set accuracy than train set accuracy?开发集精度比训练集精度高可以吗?
【发布时间】:2018-10-06 10:13:10
【问题描述】:

我在大约 102 个花卉类上训练了一个 Densnet121 架构。

数据是 102 个类别中每个类别的训练集、有效集和测试集中的大约 10-20 张图像。

我确实添加了一些大约 0.5 的 dropout,我注意到训练准确度约为 70%,验证准确度为 94%。

请让我知道下一步我应该做什么,因为根据我的理解,它没有被归类为高方差问题,如果我尝试非常好地拟合训练数据(处理偏差),恐怕它会影响我很好地拟合验证数据的能力,因为我在那里得到了 94% 的准确率,所以我不想伤害它。

【问题讨论】:

  • 提问前请先通过*.com/help/how-to-ask,我更希望你把这个问题放到DataScience社区。​​span>
  • @EMKAY “我更喜欢”在这里不是一个合适的表达方式......
  • 您的问题过于模糊和宽泛,您选择的标题与您的帖子不一致...
  • @EMKAY 虽然这个问题需要进一步澄清,但这些问题或多或少是在数据科学社区和 * 的交叉点上,因为它们产生的问题可能与实现相关,而不仅仅是理论上的,所以他们在家里。

标签: python machine-learning deep-learning image-recognition


【解决方案1】:

数据是 102 个类别中每个类别的训练、有效和测试集中大约 10-20 张图像。

我会尝试将有效集和测试集减少到每个类 5 张图像,并让它运行更多的训练迭代。 另外,尝试使用大约 0.1-0.2 的 dropout

【讨论】: