【发布时间】:2015-09-24 11:00:48
【问题描述】:
当尝试使用 scrapy 查看或抓取 http://www.kw.com/kw/agent/johndoucette(或该域上的大多数页面)时,我返回一个空白页面。查看页面源代码会返回一堆隐藏的 javascript,但仅此而已。
我尝试了许多不同的用户代理、代理、无代理、设置等(例如 scrapy view http://www.kw.com/kw/agent/johndoucette -s USER_AGENT="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/4302357130 Safari/537.36" 来自 here)这不是我的设置 - 它可以从新的 scrapy shell view(response) 命令重现安装。我只是不知道如何忽略该脚本。
有没有办法解决这个问题?
【问题讨论】:
标签: javascript python django scrapy