Weka 中的测试用例

【问题标题】：Test cases in WekaWeka 中的测试用例
【发布时间】：2012-03-30 09:30:15
【问题描述】：

鉴于我可能有一个按以下形式编写的 ARFF 文件：

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam

我要运行这个来在 Weka 上训练一个朴素贝叶斯分类器。我将如何创建一个测试集，以便这个训练有素的分类器能够做出预测？谢谢。

【问题讨论】：

下载您自己的收件箱和垃圾邮件箱的副本，编写脚本将邮件转换为垃圾邮件并检查您是否得到与您的电子邮件提供商所做的相同预测。

标签： machine-learning weka email-spam document-classification

【解决方案1】：

您可以在许多数据库中找到垃圾邮件和非垃圾邮件示例（来自现实生活）。然后，获取垃圾邮件/非垃圾邮件的正文并制作一个类似的 arff 文件（但这次它将测试 arff 文件），并带有适当的标签（垃圾邮件正文为垃圾邮件，非垃圾邮件正文为 notspam ）。使用您的训练 arff 文件，您将获得一个分类器模型。保存该模型。然后在 Weka 资源管理器分类选项卡上，选择单选按钮“测试集”并选择您的测试集（尽管它会有标签）。然后加载您的训练模型，右键单击它，然后选择使用测试集重新评估。你已经完成了。

【讨论】：