【发布时间】:2025-12-30 04:40:15
【问题描述】:
我正在抓取一个网站,我需要从这个 HTML 文档中获取数值:
<td>
<span style=" color: red; font-weight: bold;"> 1.950</span>
</td>
<td> 3.400</td>
我需要同时提取 1.950 和 3.400,但是当一个值仅在 a 中,而另一个值也有跨度时,我不知道该怎么做。有没有一种通用的方法来获取路径的父级和子级?我正在使用scrapy 框架和HtmlXPathSelector。我可以将/td/text() 用于其中一个,将/td/span/text() 用于另一个,但我需要在一个查询中执行此操作。如何实现?
【问题讨论】: