【发布时间】:2020-01-06 06:15:06
【问题描述】:
尝试从页面中提取产品名称:
https://www.v12outdoor.com/view-by-category/rock-climbing-gear/rock-climbing-shoes/mens.html
找不到返回有用的特定结果的 XPATH。
很抱歉我的第一篇文章是一个初学者的问题:(
class V12Spider(scrapy.Spider):
name = 'v12'
start_urls = ['https://www.v12outdoor.com/view-by-category/rock-climbing-gear/rock-climbing-shoes/mens.html']
def parse(self, response):
yield {
'price' : response.xpath('//span[@id="product-price-26901"]/text()'),
'name' : response.xpath('//h3[@class="product-name"]/a/text()'),
}
对于name,我希望使用类product-name 的h3 标记中的项目生成名称,但生成多行数据='\r\n
(虽然我们在为price 使用它,但有没有办法只提取数值?)
【问题讨论】: