【发布时间】:2013-06-05 17:35:39
【问题描述】:
我的蜘蛛需要在一定程度上适应我正在抓取的网站,因为我需要获取的信息有时在 div[1] 中,有时在 div[2] 中。这是一个例子:
item['details'] = site.select('//*[@id="detailFacts"]/div[2]/div[2]//text()').extract()
或
item['details'] = site.select('//*[@id="detailFacts"]/div[1]/div[2]//text()').extract()
如何将这两者结合在一个语句中,以便scrapy 从其中任何一个中获取我?
【问题讨论】:
标签: python xpath web-scraping scrapy