【问题标题】:get text part upto a specific tag in xpath获取文本部分到 xpath 中的特定标签
【发布时间】:2021-10-20 18:11:54
【问题描述】:

我正在尝试使用 Xpath 获取文本直到第一个 <.hr>(忽略点)标记

<div class="entry">
   <p> some text</p>
   <p> some text2</p>
   <p> some text3</p>
   <p> some text4</p>
   <hr>(get text part before this hr tag)
   <p> some text5</p>
   <hr>
   <p> some text6</p>
</div>

试过了

//hr[1]/ancestor::div[@class="entry"]/text()

以及一些类似的变体,但无法获得预期的输出

【问题讨论】:

    标签: html web-scraping xpath web-crawler


    【解决方案1】:

    类似的东西会给你hr节点之前的节点集

    //div[@class="entry"]/*[not(preceding-sibling::hr | self::hr)]
    

    它将列出那些节点

    • 是类名为“entry”的 div 的子项,
    • 前面没有名为 hr 和的节点
    • 本身不是hr 节点

    【讨论】:

    • 感谢很多人为此奋斗了几个小时。
    猜你喜欢
    • 1970-01-01
    • 2014-01-14
    • 2013-06-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-10-21
    • 2017-01-09
    • 1970-01-01
    相关资源
    最近更新 更多