【问题标题】:Cluster and rank blogs by logical categories按逻辑类别对博客进行聚类和排名
【发布时间】:2010-12-04 07:45:01
【问题描述】:

什么样的算法可以对逻辑社区(科技、娱乐等)中的博客进行聚类和排名?

对博客文章进行聚类和排名的算法会更好。

接受的答案是算法、伪代码、java 代码或特定算法解释的链接。

更新: 所以,我似乎想要Partional Clustering 类别的东西,主要是基于文本特征。

【问题讨论】:

    标签: algorithm machine-learning blogs


    【解决方案1】:

    首先你必须通过定义一个更好地定义你的问题:

    1. 每个博客的特征向量(一个描述符)
    2. 用于评估描述符之间“距离”的指标。

    完成此操作后,您就有一大堆 clustering algorithms 可供选择,例如 kmeans 等。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-08-15
      • 2017-07-28
      • 2017-04-26
      • 2015-03-06
      相关资源
      最近更新 更多