从Java HtmlUnit中的两个标签之间获取信息[重复]答案

【问题标题】：Get information from between two tags in Java HtmlUnit [duplicate]从Java HtmlUnit中的两个标签之间获取信息[重复]
【发布时间】：2017-03-16 13:52:14
【问题描述】：

<span>
<a></a>
Hello
<div>A very lot of unnecessary text</div>
</span>

所以我想从网页中提取“Hello”。我可以通过 XPath 选择跨度，但如果我在其上调用 .getTextContent() ，我也会得到 div 中的内容，但我希望不要提取这些不必要的文本。我该怎么做？

【问题讨论】：

请提供您目前尝试的示例代码。
String s = page.getElementsByTagName("span").get(0).getTextContent();
不知道怎么获取anchor和div之间的文字

标签： java html htmlunit

【解决方案1】：

您应该可以使用 xpath 直接获取文本，如link的答案所示

【讨论】：