【发布时间】:2015-09-12 07:48:42
【问题描述】:
我有一个包含数十万个论坛帖子的数据库,并希望以无人监督的方式标记它们。
我注意到 StackOverflow 的标签系统会在我进行时建议标签。这个算法是如何工作的?
我还发现这意味着它是基于 SVM 的——它是官方的吗? http://dl.acm.org/citation.cfm?id=2660970&dl=ACM&coll=DL&CFID=522960920&CFTOKEN=15091676
【问题讨论】:
-
我不知道确切的答案,但我几乎可以肯定他们使用推荐引擎进行标记。这是推荐引擎实际设计的任务(标记)之一。我相信他们将推荐器与基于项目的方法一起使用。您可以在 Mahout in action 中阅读更多内容(我个人认为这是这方面最好的书籍之一)
-
我很惊讶没有人回答这个问题。这绝对是一件值得知道的事情。
-
同意。你有没有得到关于这个主题的更多信息?
标签: machine-learning svm tagging