【问题标题】:Jsoup Parsing double quotes as &quot and single quotes as double quotesJsoup将双引号解析为&quot,将单引号解析为双引号
【发布时间】:2018-09-05 02:56:02
【问题描述】:

我正在尝试解析 HTML 文档。在文档中,有 span-data-personalization = '{"one":["two"]}' 转换为 span-data-personalization = "{&quotone&quot:[&quottwo&quot]}" 解析时。双引号转换为 &quot,单引号转换为双引号。我也使用过 doc.outputSettings().prettyPrint(false);没有成功。此外,在jsoup - stop jsoup from making quotes into & 中进行了建议的更改它仍然没有工作。而且,我也尝试过更新 Jsoup 版本。似乎没有任何效果。有人有什么建议吗?

谢谢。

【问题讨论】:

标签: java html parsing jsoup double-quotes


【解决方案1】:

JSoup Parser 类有一个内置的 unescapeEntities​ 方法。来自JSoupdocumentation

public static String unescapeEntities​(String string, boolean inAttribute)

从字符串中取消转义 HTML 实体的实用方法

参数:

string - HTML 转义字符串

inAttribute - 如果要在严格模式下转义字符串(与属性一样)

返回: 一个未转义的字符串

【讨论】:

  • 您好,谢谢。此方法完美解析字符串。但它将它存储在一个字符串中。我需要将其存储在文档中。知道我该怎么做吗?
  • @ShashankS 不幸的是,我还没有找到在文档对象上转义它的方法。如果您需要选择值并对其进行处理,这是我能找到的最好的方法。
猜你喜欢
  • 2021-11-11
  • 1970-01-01
  • 2022-11-23
  • 1970-01-01
  • 2023-04-07
  • 2018-11-18
  • 1970-01-01
  • 2013-05-26
  • 2015-12-18
相关资源
最近更新 更多