【问题标题】:How to get the page title from Wikipedia page URL? [closed]如何从维基百科页面 URL 获取页面标题? [关闭]
【发布时间】:2020-08-11 17:18:05
【问题描述】:

我正在尝试创建一个系统,用户将在其中输入他们的 Wikipedia 页面链接,并且应用程序将从 Wikipedia 页面 URL 获取页面标题。

比如,如果用户给出:https://id.wikipedia.org/wiki/Eminem,我想得到页面标题Eminem

或者如果用户给出:https://id.wikipedia.org/wiki/Eminem#1992%E2%80%931997:_Awal_karier,_Infinite_dan_masalah_keluarga,我想要页面标题,也就是Eminem

我已尝试找到 regex 模式。我正在考虑是否可以创建/找到一个正则表达式模式,该模式将找到位于/wiki/ 之间并以/ 结尾的单词。到目前为止还没有找到任何方法来做到这一点。

那我该怎么办?我还有什么其他选择?

【问题讨论】:

  • 为什么不请求维基百科页面从呈现的 HTML 中获取标题 - 或者使用维基百科的网络服务? en.wikipedia.org/api/rest_v1
  • @Dai 知道我如何通过 Wikipedia API 做到这一点吗?
  • 感谢moddy #8459 - 不和谐,在这方面帮助我

标签: javascript regex regex-group wikipedia


【解决方案1】:

这会部分起作用:/(?<=https?:\/\/..\.wikipedia\.org\/wiki\/).+(?=\/(.+)?|#)/ 但是,如果没有 / 最后它就无法工作。

【讨论】:

  • 您可以在收到输入网址后在末尾动态添加/
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-09-15
相关资源
最近更新 更多