【发布时间】:2016-08-27 18:44:30
【问题描述】:
我有一个 6 维训练数据集,其中有一个完美的数字属性,它以这种方式分隔所有训练示例:如果 TIME=200,则示例属于 class2。 J48 创建一棵只有 1 级的树,并且该属性作为唯一的节点。
但是,测试数据集不遵循这个假设,并且所有示例都被错误分类。我无法确定这种情况是否被认为是过度拟合。我想说这并不是因为数据集那么简单,但据我了解过拟合的定义,它意味着对训练数据的高度拟合,这就是我所拥有的。有什么帮助吗?
【问题讨论】:
-
除了class1和class2还有其他类吗?
-
不,只有两个类。
-
那么为什么需要更多信息来对示例进行分类?换句话说,训练数据存在缺陷,因为您不需要更多信息来对示例进行分类。
标签: machine-learning artificial-intelligence classification decision-tree supervised-learning