【发布时间】:2017-05-09 16:15:25
【问题描述】:
无论如何我可以让 python 点击一个链接,比如 bit.ly 链接,然后抓取生成的链接?当我抓取某个页面时,我唯一可以抓取的链接是一个重定向的链接,它重定向到的地方就是我需要的信息所在的位置。
【问题讨论】:
-
是的。但是,如果我们不更准确地知道它的作用,我们不知道如何修复您的程序。请提供一个简短(五行或六行)完整程序来演示您的问题。 Edit 你的问题包括整个minimal reproducible example。谢谢!
-
requests自动执行HTTP重定向,并将所有网址的信息保存在r.history中。如果页面使用HTML重定向(在<meta>标记中),那么您可以轻松找到它并将requests与此url 一起使用。requests不能只重定向JavaScript重定向,因为它不执行 JavaScript,而且可能有太多可能的重定向方法无法在代码中找到 url。
标签: python parsing web-scraping beautifulsoup lxml