【发布时间】:2014-12-28 08:03:58
【问题描述】:
我在我的项目中使用 Weka。 我有两个数据集:
- train.arff -> 20 个属性和 1 个类
- test.arff -> 20 个属性,并且类被标记为“?”
我通过百分比分割训练模型并将模型保存到 NaiveBayes.model。然后我加载模型,选择 Supplied 测试集,检查 Output Predictions 并根据当前测试集重新评估模型。
结果显示:
=== Predictions on test set ===
inst#, actual, predicted, error, probability distribution
=== Summary ===
Total Number of Instances 0
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0 0 0 0 0 ? 6.0
0 0 0 0 0 ? 5.0
0 0 0 0 0 ? 7.0
0 0 0 0 0 ? 4.0
0 0 0 0 0 ? 2.0
0 0 0 0 0 ? 1.0
0 0 0 0 0 ? 3.0
0 0 0 0 0 ? NA
Weighted Avg. NaN NaN NaN NaN NaN NaN
但实际上,我在 test.arff 中有 2000 条记录。
有人可以帮忙吗?谢谢!
【问题讨论】:
-
如果您使用的是 gui,在分类选项卡中我会选择“更多选项”并启用“输出预测”。如果它实际上是在预测测试实例,这可能会给您一些见解。我怀疑它是,但没有报告结果,因为它不知道它的预测是否正确(因为问号)
-
Weka ignoring unlabeled data 的可能重复项
标签: weka prediction training-data