【问题标题】:How can I get wikipedia xml page including all information which I need?如何获取包含我需要的所有信息的 wikipedia xml 页面?
【发布时间】:2020-05-03 16:15:50
【问题描述】:

我将 enwiki-20110115-abstract.xml 作为图像 1 中的以下内容: enter image description here

我也有 enwiki-20110115-pages-articles.xml 如下图 2: enter image description here

我需要的是第一个文件 (enwiki-20110115-abstract.xml) 中的所有信息标签和来自同一维基百科页面的第二个文件 (enwiki-20110115-pages-articles.xml) 中的重定向信息。请是否有任何版本的维基百科同时包含这些信息,或者我可以做些什么来获取这些数据?我考虑过加入两个文件,但计算成本会非常高。!!!

【问题讨论】:

    标签: wikipedia wiki wikipedia-api wikidata-api pywikibot


    【解决方案1】:

    Pywikibot 有一个在页面生成器中实现的 XMLDumpPageGenerator 和一个 xmlreader 模块

    【讨论】:

      猜你喜欢
      • 2016-11-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-01-25
      • 1970-01-01
      相关资源
      最近更新 更多