【发布时间】:2021-06-04 12:11:33
【问题描述】:
我正在尝试从维基百科页面的摘要部分中提取链接。我尝试了以下方法:
这个url提取了Deep learning页面的所有链接:
https://en.wikipedia.org/w/api.php?action=query&prop=links&titles=Deep%20learning
为了提取与任何部分关联的链接,我可以根据部分 id 进行过滤 - 例如,
对于同一页面的Definition 部分,我可以使用此网址:https://en.wikipedia.org/w/api.php?action=parse&prop=links&page=Deep%20learning§ion=1
对于同一页面的Overview 部分,我可以使用此网址:https://en.wikipedia.org/w/api.php?action=parse&prop=links&page=Deep%20learning§ion=2
但我无法弄清楚如何仅从 summary 部分中提取链接
我什至尝试使用 pywikibot 提取链接页面并调整 plnamespace 变量,但无法仅获取摘要部分的链接。
【问题讨论】:
标签: mediawiki wikipedia-api mediawiki-api pywikibot