【问题标题】:Getting a list of all URLs redirecting to a Wikipedia page?获取重定向到维基百科页面的所有 URL 列表?
【发布时间】:2016-07-11 20:41:29
【问题描述】:

我需要知道所有不同的 URL,这些 URL 指向我正在做的一个项目的同一个 Wikipedia 文章 URL。例如:

https://en.wikipedia.org/wiki/Lucite

重定向到最终 URL:

https://en.wikipedia.org/wiki/Poly(methyl_methacrylate)

但是,我不确定有多少其他 URL 也重定向到该页面的最终 URL,这是每个其他 Wikipedia 文章的问题。是否有一个特定的 API 调用我没有看到您可以发送最终的 page_name/URL,它会返回重定向到最终 URL 的所有名称/URL 的 JSON?如果它存在,我真的需要这样的东西。作为参考,我已经看过了,我知道您可以对所有页面执行两次 API 调用,如下所示:

https://en.wikipedia.org/w/api.php?action=query&generator=allpages&format=json&gaplimit=500&gapfilterredir=nonredirects

然后是不过滤重定向的那个

https://en.wikipedia.org/w/api.php?action=query&generator=allpages&format=json&gaplimit=500&

我知道您可以将这两组不相交而那些是重定向 URL,并且您可以无限期地对所有页面执行此操作并找到所有重定向名称/URL,但这会为我的项目节省指数时间如果我能简单地找到一种将 URL 发送到 Wikipeidia 的 API 的方法,并以某种方式获取返回到最终页面 URL 的所有 URL 的列表。先感谢您!

【问题讨论】:

  • 请注意,虽然您可以获得重定向到给定页面的 pages 列表,但由于 URL,重定向的 URLs 列表是无限的正常化。例如,LuciteLucite_Lucite__ 都会重定向到同一个地方。
  • 请注意谢谢。谢天谢地,我只需要在维基百科上直接映射重定向,如下面的答案,因为我想确保我存储了所有可能的指向特定页面的href,因为这样我就不会误算每篇维基百科文章有多少“内部反向链接”贯穿整个维基百科本身。

标签: mediawiki wikipedia wikipedia-api


【解决方案1】:

【讨论】:

  • 这正是我想要的。非常感谢!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-12-11
  • 2020-06-11
相关资源
最近更新 更多