【发布时间】:2020-09-06 03:09:12
【问题描述】:
我正在使用尖叫青蛙,我想使用 XPath 来实现。
从主体内容中提取包含某个类的所有链接和锚点 但我想排除 div.list
中的所有链接现在我正在尝试这个,但效果不太好,而且我希望它尽可能以文本形式吐出。
//div[@class="page-content"]/*[not(class="list")]//a[@data-wpel-link="internal"]
有人有想法吗?
【问题讨论】:
标签: html xml xpath web-scraping