【发布时间】:2020-07-21 22:59:54
【问题描述】:
我正在尝试为 java 寻找像 C#htmlagilitypack 这样的库来解析 HTML 并使用 XPath 选择元素。
我已经阅读了许多库,但它们都不是用于 HTML 的独立 XPath 选择器,我发现的所有库都需要使用它们的方法解析 HTML,例如 htmlunit。
如果有人可以通过 XPath 2.0 或 3.0 和 HTML 解析的简单示例指导我,我将不胜感激。
【问题讨论】:
-
Selenium 可以从 html 中选择 xpathes
-
我正在寻找一个库来输入 html 字符串并使用 xpath 选择器。 Selenium 需要打开浏览器。
-
你试过了吗:github.com/code4craft/xsoup。它支持 XPath 1.0 并有一些其他的内置功能。
-
Saxon-HE 的 s9api 似乎是要走的路。
-
对于 htmlunit,您可以使用 html 字符串作为输入(参见常见问题解答)来获取页面,然后使用 XPath。