【发布时间】:2021-03-24 01:46:06
【问题描述】:
我想通过 XPath 处理一个 HTML 节点。我正在使用 python。
<p>Hi, find your product <a href="/external.php">here</a>. Or visit <em>main website</em> more times.</p>
我想提取p 元素的组成,以获取列表中的值:
- 文本:您好,找到您的产品
-
node
a(以后会用@href) - 文字:。或访问
-
节点
em(我稍后会用text()) - 文本:更多次。
我尝试使用block.xpath("./text()") - 得到了['Hi, find your product ','. Or visit ',' more times.']
然后,block.xpath("./*[self::a or self::em]") - 只得到 a 和 em 元素,没有文字。
如何构建 XPath 查询以正确顺序获取文本和所需节点?
【问题讨论】: