【发布时间】:2014-01-14 16:12:07
【问题描述】:
我有 34 个特征训练集,在特征选择之后只考虑了 10 个最佳特征。我保存了模型并尝试使用经过训练的模型重新评估测试集。总是弹出说测试集和训练集不匹配,一件事是测试集包含所有 34 个参数,我什至尝试删除除所选参数之外的所有其他参数,仍然出现一些错误,我是对结果不满意,所以请在这方面帮助我
【问题讨论】:
标签: classification weka
我有 34 个特征训练集,在特征选择之后只考虑了 10 个最佳特征。我保存了模型并尝试使用经过训练的模型重新评估测试集。总是弹出说测试集和训练集不匹配,一件事是测试集包含所有 34 个参数,我什至尝试删除除所选参数之外的所有其他参数,仍然出现一些错误,我是对结果不满意,所以请在这方面帮助我
【问题讨论】:
标签: classification weka
特征选择过程也必须应用于测试集。您可以通过使用命令行界面中的批处理选项 (-b) 来执行此操作。只需键入以下命令即可获取选项:
java weka.filters.supervised.attribute.AttributeSelection -b -h
这是一个例子,adapted from this post。
java weka.filters.supervised.attribute.AttributeSelection -E \\
weka.attributeSelection.InfoGainAttributeEval \\
-S "weka.attributeSelection.Ranker -T 0.0" \\
-b -i training.arff -o training.ig0.arff -r test.arff -s test.ig0.arff
【讨论】: