【发布时间】:2020-04-08 14:27:27
【问题描述】:
我正在使用 scrapy css 选择器提取以下 html 并将其加载到项目加载器。
如何提取td 的文本,其中td 包含一个div 类sweetness
即我要提取文字Dry。
HTML 代码:
<tr>
<td>
<div class="grape">
</div>
Cabernet Sauvignon
</td>
<td>
<div class="sweetness">
</div>
Dry
</td>
</tr>
在scrapy ItemLoader中,我定义了一个字段sweetness,但是我不确定这个css选择查询是什么。
PYTHON 代码:
def parse_wine(self, response):
wine_item = response.meta['wine_item']
loader = ItemLoader(item=wine_item, response=response)
...
loader.add_css('sweetness', '????')
yield loader.load_item()
【问题讨论】: