【发布时间】:2020-03-16 10:53:18
【问题描述】:
我有类似的 HTML 字符串
<b>test</b><b>er</b>
<span class="ab">continue</span><span> without</span>
我想折叠相似且属于彼此的标签。在上面的示例中,我想要
<b>tester</b>
因为标签具有相同的标签,没有任何进一步的属性或样式。但是对于span 标签,它应该保持不变,因为它有一个class 属性。我知道我可以通过 Jsoup 在树上进行迭代。
Document doc = Jsoup.parse(input);
for (Element element : doc.select("b")) {
}
但我不清楚如何向前看(我猜像nextSibling),而不是如何折叠元素?
或者存在一个简单的正则表达式合并?
我可以自己指定的属性。不需要万能的标签解决方案。
【问题讨论】: