【发布时间】:2016-04-29 09:59:06
【问题描述】:
在这个网站上:http://www.yankeecandle.com/browse/candles/jar-candles/_/N-9yf
使用 import.io 从页面获取数据。
我正在寻找只能以最低价格获得的 XPath,即 10.99 和 12.50。
我似乎无法在 span 中包含文本。
.//div[@class="prod-details"]/p[3]
给我所有的价格
.//div[@class="prod-details"]/p[3][not(span)]
不仅忽略 span 文本,还忽略 class="sl-prce price" 内的文本
所以问题是,我可以从屏幕截图中得到“销售 12.50”,而不是跨度中的 24.99。
不应用 Regex 可以做到吗?
【问题讨论】:
-
//div[@class="prod-details"]/p[3]/text()