【发布时间】:2011-03-16 19:51:05
【问题描述】:
我有一个大约 1700 万个句子的列表。我需要将句子识别为垃圾邮件/火腿/不确定。互联网上是否存在训练有素的模型,我可以将我的数据作为“测试”集输入,系统会将我的句子分类为垃圾邮件/火腿?
注意:这些句子不是电子邮件。
【问题讨论】:
标签: machine-learning spam-prevention
我有一个大约 1700 万个句子的列表。我需要将句子识别为垃圾邮件/火腿/不确定。互联网上是否存在训练有素的模型,我可以将我的数据作为“测试”集输入,系统会将我的句子分类为垃圾邮件/火腿?
注意:这些句子不是电子邮件。
【问题讨论】:
标签: machine-learning spam-prevention
您可以使用贝叶斯垃圾邮件过滤,看看这篇文章很好理解理论http://robotics.stanford.edu/users/sahami/papers-dir/spam.pdf
【讨论】: