【发布时间】:2023-03-06 18:48:01
【问题描述】:
我有类似的东西
Whitelist whitelist = new Whitelist();
whitelist.addTags("p", "i", "b", "em", "strong", "u");
String content = Jsoup.clean(data.html(), whitelist);
在我的代码中。但是 Jsoup 库删除了 " 和 '。我该如何防止这种情况发生。
例如= 天气晴朗。
结果 = 它?晴天。
【问题讨论】:
-
你能给出一个你传递给清理的示例html以及清理的结果吗?
-
被删除的引号在哪里?在 HTML 中,属性值的引号?
-
我猜你将不得不跳过引号。像“\”p\“”之类的东西。只是一个想法。
标签: java html-parsing jsoup