【发布时间】:2021-11-24 17:37:57
【问题描述】:
我目前正在尝试检索网页上的所有元素,不包括链接及其子元素。
页面组成如下:
<body>
<p>
...
<a href='...'>
<strong> ... </strong>
</a>
...
</p>
<p>
...
<a href='...'>
<strong> ... </strong>
</a>
...
</p>
</body>
我能够使用//body//*[not(@href)] 获取除链接之外的所有元素。
不过,我也捕获了包含 href 属性的元素的子元素。
如何过滤掉包含href 属性及其子属性的元素?
【问题讨论】: