【发布时间】:2019-11-14 05:40:52
【问题描述】:
我创建了一个 xpath 表达式来定位一个元素,这样我就可以使用 scrapy 中的 xpath 从一些 html 元素中提取某些信息。反正我也达不到。
HTML 元素:
<div class="rates">
<label>
Rates :
</label>
R 3500
<br class="hidden-md hidden-lg">
</div>
我希望从中提取R 3500。
我试过了:
from scrapy import Selector
html = """
<div class="rates">
<label>
Rates :
</label>
R 3500
<br class="hidden-md hidden-lg">
</div>
"""
sel = Selector(text=html)
rate = sel.xpath("//*[@class='rates']/label/following::*").get()
print(rate)
运行上面的脚本后,我得到了<br class="hidden-md hidden-lg">,而我希望得到R 3500。
如果选择lxml,我可以使用.tail。然而,当我去scrapy时,我没有发现任何类似的东西。
如何使用 xpath 从 html 元素中提取该比率?
【问题讨论】:
标签: python python-3.x xpath scrapy css-selectors