【发布时间】:2015-01-05 20:02:56
【问题描述】:
我遇到了以下问题:我正在从网站上抓取价格,它可以工作,但它只需要逗号前面的数字。
示例:当某物价值“79 欧元,90”时,它只会刮掉 79,而不是 90。
<span class="price right right10">
€ 79,
<sup>
90*
</sup>
</span>
我想将它存储在一个项目字段中,如下所示:
class Prices(scrapy.Item):
price = scrapy.Field()
这是我当前的 xpath 选择器:
item['price'] = ''.join(sel.xpath('div[@class="waresSum"]/p/span/text()').extract())
【问题讨论】:
标签: python xpath web-scraping scrapy