【发布时间】:2017-08-08 12:50:06
【问题描述】:
这是我的简单蜘蛛代码(刚开始):
def start_requests(self):
urls = [
'http://www.liputan6.com/search?q=bubarkan+hti&type=all',
]
for url in urls:
yield scrapy.Request(url=url, callback=self.parse)
def parse(self, response):
page = response.url.split("/")[-2]
filename = 'quotes-%s.html' % page
with open(filename, 'wb') as f:
f.write(response.body)
self.log('Saved file %s' % filename)
使用浏览器我可以正常访问 url 'http://www.liputan6.com/search?q=bubarkan+hti&type=all'。但是为什么用这个scrapy我得到302响应,并且我无法抓取页面..
请任何人告诉我,如何解决它..
【问题讨论】:
标签: python search scrapy web-crawler