【问题标题】:Tools to generate concepts and concept graph for searched articles为搜索的文章生成概念和概念图的工具
【发布时间】:2016-04-21 07:10:37
【问题描述】:

当使用Springer等在线图书馆搜索论文时,返回的结果还会显示从该论文中自动提取的相关概念以及基于这些概念的一些知识关系图。以下是搜索输出的屏幕截图。

我想知道哪种算法和软件能够生成这种输出。是否有任何开源工具能够做到这一点?

【问题讨论】:

标签: search elasticsearch machine-learning search-engine information-retrieval


【解决方案1】:

使用的算法是 K-Means。 K-Means 是一种无监督聚类算法。文章按主题分类。有些文章包含多个主题,其中许多文章之间是相同的。然后,这些共享主题是从初始主题中出现的分支。 SKLearn 是一个很棒的 Python 库,可以很好地进行聚类。 R 也非常适合聚类。希望这会有所帮助!

【讨论】:

  • 这里极不可能使用 K-Means。首先,K-Means(通常)具有一对一的关系。示例中不是这种情况。无论是对于文字,还是对于文档。其次,k-means 存在 Concentration of MeasureCurse of Dimensionality,不适合文本分类。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2014-07-02
  • 1970-01-01
  • 1970-01-01
  • 2016-09-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多