【问题标题】:Query wikipedia查询维基百科
【发布时间】:2014-12-10 17:47:47
【问题描述】:

我想查询两个或三个术语,以便在 Wikipedia 的条目中找到它们。具体来说,我正在尝试查看是否在条目的第一段(摘要)中重复了某些术语。可以直接或通过 dbpedia。谢谢

【问题讨论】:

  • 使用什么语言?你能举个例子说明你想要达到的目标吗?
  • 可以在 python 或 SPARQL 中。这是另一个 stackoverflow 用户的示例:SELECT ?uri ?txt WHERE { ?uri rdfs:label ?txt 。 ?txt bif:contains "'Egypt' AND 'Pyramid'" 。问题是它只返回在类别标签上找到的那些关键字。我想在文本或摘要中找到所有包含这两个关键字的文档。

标签: nlp wikipedia wikipedia-api


【解决方案1】:

使用 Mediawiki API,您可以找到包含这些关键字的文章。 试试API:Search 文档。

为了做您想做的事,您可能还需要找到具有这些关键字的文章,然后解析文本以检查它们是否在第一段中。

有了这个:

?action=parse&page=Nicolas_Cage&prop=text&section=0

您可以获得页面第一部分的 HTML(参见 post)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-05-24
    • 1970-01-01
    • 1970-01-01
    • 2016-08-16
    • 2010-10-12
    • 2011-04-22
    • 2021-08-12
    相关资源
    最近更新 更多