【发布时间】:2010-12-20 21:07:06
【问题描述】:
我正在使用 Weka 的资源管理器功能进行分类。
所以我有我的 .arff 文件,具有 NUMERIC 值的 2 个特征,我的类是二进制 0 或 1(例如 {0,1})。
示例:
@RELATION summary
@ATTRIBUTE feature1 NUMERIC
@ATTRIBUTE feature2 NUMERIC
@ATTRIBUTE class {1,0}
@DATA
23,11,0
20,100,1
2,36,0
98,8,1
.....
我加载这个 .arff 文件,使用 10 倍交叉验证(无测试文件),然后选择 NaiveBayes,然后我对数据进行分类,它给了我:5 个错误标记,100 个正确标记。到目前为止一切顺利。
现在,我对我的 .arff 文件进行了重大更改(为我的特征属性提供完全随机的值)。重复上述操作,我在分类时得到完全相同的统计数据。
我尝试对我的 .arff 文件进行更多更改,使用不同的分类算法。尽管如此,无论我给我的 .arff 文件赋予什么值,完全相同的统计数据(在相同的算法中)。
我在这里做错了吗?
【问题讨论】:
-
既然这个问题已经解决了,能否更新一下标题,更具体一些?
标签: machine-learning data-mining classification weka