【发布时间】:2017-07-05 18:57:30
【问题描述】:
我已经成功地使用 Wikipedia pagelinks SQL 转储来获取特定修订时间的 Wikipedia 页面之间的超链接。
但是,在某些情况下,此类链接存在多个实例,例如相同的https://en.wikipedia.org/wiki/Wikipedia 页面和https://en.wikipedia.org/wiki/Wikimedia_Foundation。我有兴趣找到特定版本的页面对之间的链接数量。
理想的解决方案将涉及转储文件而不是页面链接(我不知道),或使用 MediaWiki API。
【问题讨论】: