【发布时间】:2016-04-25 13:51:28
【问题描述】:
可以使用多种技术来检测特定语言的垃圾邮件,如果采用适当的技术,可以使系统能够检测多种语言的垃圾邮件,但这要求单个文本采用特定语言。
所以我的问题是如何检测由多种语言组成的文本?这不仅与语言检测有关。我想了解一些进行多语言垃圾邮件检测的最佳做法。
【问题讨论】:
标签: machine-learning nlp spam-prevention email-spam spamassassin
可以使用多种技术来检测特定语言的垃圾邮件,如果采用适当的技术,可以使系统能够检测多种语言的垃圾邮件,但这要求单个文本采用特定语言。
所以我的问题是如何检测由多种语言组成的文本?这不仅与语言检测有关。我想了解一些进行多语言垃圾邮件检测的最佳做法。
【问题讨论】:
标签: machine-learning nlp spam-prevention email-spam spamassassin
一个简单的解决方案仍然是使用翻译 API 按语言将文本分割成片段。然后按语言对文本片段进行分类。
这是一个简单的解决方案,但我担心经常调用翻译 API 的性能。
我想知道大公司或一些优秀的项目如何处理这个问题?
【讨论】: