【发布时间】:2012-01-22 05:46:21
【问题描述】:
有没有办法让 jsoup 通过转义不需要的 HTML 而不是完全删除它来清除其中包含 HTML 的字符串?我的例子:
String dirty = "This is <b>REALLY</b> dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
String clean = Jsoup.clean(dirty, new Whitelist().addTags("a").addAttributes("a", "href", "name", "rel", "target"));
这给出了一个“干净”的字符串:
This is REALLY dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
我想要的是“干净”的字符串:
"This is <b>REALLY</b> dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
【问题讨论】:
-
不错的一个。不,Jsoup 不支持它。您可能想在github.com/jhy/jsoup/issues 发布功能请求,以向
WhitelistAPI 添加一个新方法,该方法可以将HTML 删除转换为HTML 转义。
标签: jsoup