【问题标题】:Number of links between two Wikipedia pages两个维基百科页面之间的链接数
【发布时间】:2017-07-05 18:57:30
【问题描述】:

我已经成功地使用 Wikipedia pagelinks SQL 转储来获取特定修订时间的 Wikipedia 页面之间的超链接。

但是,在某些情况下,此类链接存在多个实例,例如相同的https://en.wikipedia.org/wiki/Wikipedia 页面和https://en.wikipedia.org/wiki/Wikimedia_Foundation。我有兴趣找到特定版本的页面对之间的链接数量。

理想的解决方案将涉及转储文件而不是页面链接(我不知道),或使用 MediaWiki API。

【问题讨论】:

    标签: wikipedia wikipedia-api


    【解决方案1】:

    我认为你最不坏的选择是解析 Parsoid 输出;例如转到https://en.wikipedia.org/api/rest_v1/page/html/Wikipedia 并计算与选择器a[rel="mw:WikiLink"][href="./Wikimedia_Foundation"] 匹配的链接。

    【讨论】:

    • 我必须调用 api 并解析任意两篇维基百科文章之间的每个超链接...
    • 你必须这样做,是的。您可以尝试在 research list 上提问 - 也许有人已经这样做了并且可以分享数据。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2010-12-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多