【问题标题】:Multilingual text spam detection多语言文本垃圾邮件检测
【发布时间】:2016-04-25 13:51:28
【问题描述】:

可以使用多种技术来检测特定语言的垃圾邮件,如果采用适当的技术,可以使系统能够检测多种语言的垃圾邮件,但这要求单个文本采用特定语言。

所以我的问题是如何检测由多种语言组成的文本?这不仅与语言检测有关。我想了解一些进行多语言垃圾邮件检测的最佳做法。

【问题讨论】:

    标签: machine-learning nlp spam-prevention email-spam spamassassin


    【解决方案1】:

    一个简单的解决方案仍然是使用翻译 API 按语言将文本分割成片段。然后按语言对文本片段进行分类。

    这是一个简单的解决方案,但我担心经常调用翻译 API 的性能。

    我想知道大公司或一些优秀的项目如何处理这个问题?

    【讨论】:

      猜你喜欢
      • 2010-09-24
      • 2011-09-18
      • 2011-01-24
      • 2016-05-07
      • 1970-01-01
      • 2012-12-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多