【发布时间】:2015-08-04 17:51:25
【问题描述】:
我正在写论文,但遇到了一个我不知道如何正确解决的问题。
我正在对推文进行聚类,并且鉴于它们携带的信息很少,我想通过访问 Wikipedia 并考虑有关这些信息的方式来扩展我在文本中找到的实体。
当我开始查看 Wikipedia API 时,我的问题就出现了。它有如此多的属性和如此多的配置可能性,以至于我不知道如何从文章中提取相关信息,以便将实体相互关联。
我不只是看看,说太难了,就来这里问。我尝试了一些事情,至少我知道我应该向 API 询问的事情是 props 而不是 lists或元信息。
例如,我尝试将 prop=linkshere 作为有关 Pau Gasol 查询的操作,并根据文档:查找链接到给定页面的所有页面,但我得到了 当我访问 Kareem Abdul-Jabar 页面(相同的 pageid)时,我既没有找到 Pau 的任何参考,也没有找到 Pau 的 Kareem
在维基百科中展开实体的最佳查询是什么?
【问题讨论】:
-
您是否考虑了重定向?另外,你想将它们扩展成什么?
-
另外,为每条推文点击 Wikipedia API 不会扩展。使用一种不依赖公共 API 的方法。
-
我可以使用 API 的任何部分,因此也可以考虑重定向。我正在考虑一些事情,例如,如果我在一条推文中找到 Pau Gasol 而在另一条推文中找到 Rudy Gay,通过访问 Wikipedia 我发现它们与 NBA 有关,我是否应该考虑使用 DBPedia?
-
此外,卡里姆·阿卜杜勒-贾巴尔确实链接到保罗·加索尔。隐藏在导航模板的深处......它在那里,但它是一个完全没有意义的链接。所以首先弄清楚你想做什么。否则我们无法为您提供帮助。
-
我会确切地找出我想要的,然后回到这里,谢谢你的时间!
标签: entity wikipedia-api named-entity-recognition named-entity-extraction