【发布时间】:2017-06-09 14:03:22
【问题描述】:
我无法抓取此站点here 是对 python selenium phantomjs 的请求的屏幕截图。我不知道他们是如何检测到它是一个机器人,但在图片上说需要 javascript 和验证码,也许还需要什么其他的东西?我绝对不会以超人的速度刮擦,因为这是我的第一个要求,所以不是原因。附言当我在浏览器上粘贴相同的请求时,它会定向到我想要的页面并且可以正常工作。
br = webdriver.PhantomJS('bin/phantomjs')
br.set_window_size(1366, 200)
br.get("website")
br.save_screenshot(x)
【问题讨论】:
-
好吧,没关系,我现在开始工作了,我确实启用了 javascript 和假用户代理
-
您可以提交自己问题的答案并接受。其他人以后可能会发现它很有用。
-
在答案中添加了它:)
标签: javascript python selenium phantomjs