【问题标题】:XPath text and nodes in real orderXPath 文本和节点按实际顺序排列
【发布时间】:2021-03-24 01:46:06
【问题描述】:

我想通过 XPath 处理一个 HTML 节点。我正在使用 python。

<p>Hi, find your product <a href="/external.php">here</a>. Or visit <em>main website</em> more times.</p>

我想提取p 元素的组成,以获取列表中的值:

  1. 文本您好,找到您的产品
  2. nodea(以后会用@href
  3. 文字。或访问
  4. 节点em(我稍后会用text()
  5. 文本更多次。

我尝试使用block.xpath("./text()") - 得到了['Hi, find your product ','. Or visit ',' more times.']

然后,block.xpath("./*[self::a or self::em]") - 只得到 aem 元素,没有文字。

如何构建 XPath 查询以正确顺序获取文本和所需节点?

【问题讨论】:

    标签: python html xml xpath


    【解决方案1】:

    这个 XPath,

    /p/node()
    

    将根据请求选择根 p 元素的所有节点子节点

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-10-09
      • 2012-06-04
      • 1970-01-01
      • 2017-06-29
      • 1970-01-01
      • 1970-01-01
      • 2023-03-09
      相关资源
      最近更新 更多