【问题标题】:How to get associated (English) Wikipedia page from Wikidata page / Q number using Wikidata dump?如何使用 Wikidata 转储从 Wikidata 页面/Q 号获取关联的(英文)Wikipedia 页面?
【发布时间】:2018-01-19 01:25:12
【问题描述】:

仅对于 @en 文本,来自 Wikidata 转储的单个项目包含多个名称:

<http://www.wikidata.org/entity/Q26> <http://www.w3.org/2000/01/rdf-schema#label> "Northern Ireland"@en .
<http://www.wikidata.org/entity/Q26> <http://www.w3.org/2004/02/skos/core#prefLabel> "Northern Ireland"@en .
<http://www.wikidata.org/entity/Q26> <http://schema.org/name> "Northern Ireland"@en .

在本文的 Wikidata 页面 (http://www.wikidata.org/entity/Q26) 上,哪些(如果有)对应于相关(英文)Wikipedia 页面上使用的规范化名称?

【问题讨论】:

标签: rdf wikipedia wikidata linked-data


【解决方案1】:

获取谓词为 schema:partOf 且对象为您想要的维基百科的三元组(例如,https://en.wikipedia.org/)。

这是一个使用 Python 的 rdflib 的示例:

>>> import rdflib
>>> g = rdflib.Graph()
>>> r = g.parse("https://www.wikidata.org/entity/Q26.nt")
>>> for s, p, o in g:
...     if p == rdflib.URIRef('http://schema.org/isPartOf') and o == rdflib.URIRef('https://en.wikipedia.org/'):
...             print(s)
... 
https://en.wikipedia.org/wiki/Northern_Ireland

当然,您可以根据您使用的任何解析器调整此方法。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-23
    • 1970-01-01
    • 1970-01-01
    • 2020-07-25
    • 2022-01-10
    相关资源
    最近更新 更多