【发布时间】:2012-07-21 21:07:51
【问题描述】:
我的问题是我需要从旨在获取 html 文本部分的 XPath 表达式中检索原始 html。 例如,如果我得到了当前的 html:
<div class='text'>
<p class='nointerrest'> blabla </p>
<p class='goodstuff'> blablabla </p>
<p class='goodstuff'> blablabla </p>
</div>
那么我的 XPath 表达式就是字符串:
string-join(//p[@class='goodstuff'],' ')
这给了我:
"blablabla blablabla"
有没有可以返回我的 XPath 表达式:
<p class='goodstuff'> blablabla </p>
<p class='goodstuff'> blablabla </p>
作为字符串? (如果可能,使用与我原来的 XPath 表达式最相似的 XPath 表达式)
提前致谢
【问题讨论】:
-
解决方案是否必须基于 XPath?
-
是的,我需要用 XPath 表达式获取 html。
-
JDK 中的 XPath 库不适合你吗?
标签: java xpath html-parsing