【发布时间】:2017-03-16 13:52:14
【问题描述】:
<span>
<a></a>
Hello
<div>A very lot of unnecessary text</div>
</span>
所以我想从网页中提取“Hello”。我可以通过 XPath 选择跨度,但如果我在其上调用 .getTextContent() ,我也会得到 div 中的内容,但我希望不要提取这些不必要的文本。我该怎么做?
【问题讨论】:
-
请提供您目前尝试的示例代码。
-
String s = page.getElementsByTagName("span").get(0).getTextContent();
-
不知道怎么获取anchor和div之间的文字