【发布时间】:2012-08-10 07:25:45
【问题描述】:
...<b><a>hello</a></b>...
我想从 html 文档中删除 <b></b> 标记。可以使用 Jsoup 吗?
【问题讨论】:
标签: html html-parsing jsoup html-manipulation
...<b><a>hello</a></b>...
我想从 html 文档中删除 <b></b> 标记。可以使用 Jsoup 吗?
【问题讨论】:
标签: html html-parsing jsoup html-manipulation
如果 doc 是您的文档,包含您的 HTML:
doc.select("b").unwrap();
(也可以与Element / Elements 一起使用)
示例:
Document document = new Document("");
document.html("...<b><a>hello</a></b>...").select("b").unwrap();
现在您的文档不包含任何 b-Tag
【讨论】:
public String clean(String unsafe){
Whitelist whitelist = Whitelist.none();
whitelist.addTags(new String[]{"a"});
String safe = Jsoup.clean(unsafe, whitelist);
return StringEscapeUtils.unescapeXml(safe);
}
来自Removing Html tags except few specific ones from String in java
【讨论】: