【问题标题】:Selecting both links and anchors using XPath使用 XPath 选择链接和锚点
【发布时间】:2020-09-06 03:09:12
【问题描述】:

我正在使用尖叫青蛙,我想使用 XPath 来实现。

从主体内容中提取包含某个类的所有链接和锚点 但我想排除 div.list

中的所有链接

现在我正在尝试这个,但效果不太好,而且我希望它尽可能以文本形式吐出。

//div[@class="page-content"]/*[not(class="list")]//a[@data-wpel-link="internal"]

有人有想法吗?

【问题讨论】:

    标签: html xml xpath web-scraping


    【解决方案1】:

    这个 XPath,

    //a[@data-wpel-link="internal"][not(ancestor::div[@class="list"])]
    

    将选择所有具有给定属性值但没有给定类的祖先 diva 元素。

    当然,您可以为任何限制选择的遗产添加前缀,例如:

    //div[@class="page-content"]//a[@data-wpel-link="internal"]
                                   [not(ancestor::div[@class="list"])]
    

    【讨论】:

    • 谢谢。那说无效的xpath。一定是错字?
    • 很好,谢谢。知道如何以文本格式提取锚点和网址吗?
    • edit 您的问题并明确添加预期的输出。
    猜你喜欢
    • 1970-01-01
    • 2016-06-27
    • 2011-01-13
    • 1970-01-01
    • 2013-04-25
    • 1970-01-01
    • 1970-01-01
    • 2013-11-28
    • 1970-01-01
    相关资源
    最近更新 更多