【发布时间】:2013-04-26 14:30:37
【问题描述】:
我想在 HTML 页面源代码中突出显示给定 XPath 覆盖的节点。
我在 HtmlUnit 中查看,在 API 中找不到任何东西。
目前,我正在考虑以下方式:
- 获取 XPath 并获取页面源代码。
- 将 XPath 分解为更小的块并将它们存储在 Xpath_chunk[] 中。
- 从 Xpath_chunk[] 从 0 开始应用块。
- 更新每个块找到的每个节点的 css 属性(任何区分文本的更改)。
- 现在添加获取下一个块并将其与当前块连接。
- 转到步骤 3。
这样,我将访问Xpath覆盖的所有节点。通过更多更改,我可以删除那些不必要地突出显示的元素。
这太复杂了。有没有办法做到这一点 ?
【问题讨论】:
标签: java xpath html-parsing htmlunit