【发布时间】:2012-03-30 09:30:15
【问题描述】:
鉴于我可能有一个按以下形式编写的 ARFF 文件:
@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
我要运行这个来在 Weka 上训练一个朴素贝叶斯分类器。我将如何创建一个测试集,以便这个训练有素的分类器能够做出预测?谢谢。
【问题讨论】:
-
下载您自己的收件箱和垃圾邮件箱的副本,编写脚本将邮件转换为垃圾邮件并检查您是否得到与您的电子邮件提供商所做的相同预测。
标签: machine-learning weka email-spam document-classification