【发布时间】:2019-08-21 00:56:51
【问题描述】:
我目前正在尝试从 craiglist 页面上的标题中抓取 href。我正在使用 python scrapy,并且一直遇到问题
我已经尝试了几件事,我不明白出了什么问题。
import scrapy
class MySpider(scrapy.Spider):
name = "HondaUrl"
start_urls = {'https://chicago.craigslist.org/search/cta?auto_make_model=honda%20cr-v&hints=mileage&max_auto_miles=120000&min_auto_miles=1000&min_auto_year=2004&sort=date'}
def parse(self,response):
sel = Selector(response)
for href in sel.xpath('//div[@class="content"]//p[@class="result-info"]/a/@href').extract_first():
print(href)
没有显示任何错误消息,我只得到零个结果。
【问题讨论】:
标签: python python-3.x web-scraping scrapy