【问题标题】:How to use Wikipedia API to expand entities?如何使用维基百科 API 扩展实体?
【发布时间】:2015-08-04 17:51:25
【问题描述】:

我正在写论文,但遇到了一个我不知道如何正确解决的问题。

我正在对推文进行聚类,并且鉴于它们携带的信息很少,我想通过访问 Wikipedia 并考虑有关这些信息的方式来扩展我在文本中找到的实体。

当我开始查看 Wikipedia API 时,我的问题就出现了。它有如此多的属性和如此多的配置可能性,以至于我不知道如何从文章中提取相关信息,以便将实体相互关联。

我不只是看看,说太难了,就来这里问。我尝试了一些事情,至少我知道我应该向 API 询问的事情是 props 而不是 lists信息。

例如,我尝试将 prop=linkshere 作为有关 Pau Gasol 查询的操作,并根据文档:查找链接到给定页面的所有页面,但我得到了 当我访问 Kareem Abdul-Jabar 页面(相同的 pageid)时,我既没有找到 Pau 的任何参考,也没有找到 Pau 的 Kareem

在维基百科中展开实体的最佳查询是什么?

【问题讨论】:

  • 您是否考虑了重定向?另外,你想将它们扩展成什么?
  • 另外,为每条推文点击 Wikipedia API 不会扩展。使用一种依赖公共 API 的方法。
  • 我可以使用 API 的任何部分,因此也可以考虑重定向。我正在考虑一些事情,例如,如果我在一条推文中找到 Pau Gasol 而在另一条推文中找到 Rudy Gay,通过访问 Wikipedia 我发现它们与 NBA 有关,我是否应该考虑使用 DBPedia?
  • 此外,卡里姆·阿卜杜勒-贾巴尔确实链接到保罗·加索尔。隐藏在导航模板的深处......它在那里,但它是一个完全没有意义的链接。所以首先弄清楚你想做什么。否则我们无法为您提供帮助。
  • 我会确切地找出我想要的,然后回到这里,谢谢你的时间!

标签: entity wikipedia-api named-entity-recognition named-entity-extraction


【解决方案1】:

它来自像Template:Los Angeles Lakers 2009–10 NBA champions 这样的导航框,这些导航框位于页面底部的transcluded,默认情况下折叠在“相关文章的链接”框中。

【讨论】:

    猜你喜欢
    • 2014-08-04
    • 1970-01-01
    • 2015-02-12
    • 2020-05-22
    • 1970-01-01
    • 2010-10-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多