【发布时间】:2019-12-15 18:05:55
【问题描述】:
我正在尝试制作网络爬虫。我想从查询 URL 中获取目标 URL。但它会重定向很多次。
这是我的网址:
https://data.jw-api.org/mediator/finder?lang=INS&item=pub-jwb_201812_16_VIDEO
目标网址应该是:
https://www.jw.org/ins/library/videos/#ins/mediaitems/VODOrgLegal/pub-jwb_201812_16_VIDEO
但我将 https://www.jw.org/ins/library/videos/?item=pub-jwb_201812_16_VIDEO&appLanguage=INS 作为重定向的 URL。
我试过这段代码:
import requests
url = 'https://data.jw-api.org/mediator/finder?lang=INS&item=pub-jwb_201812_16_VIDEO'
s = requests.get(url)
print(s.url)
【问题讨论】:
标签: python-3.x redirect web-scraping python-requests