【问题标题】:Escape special characters/Symbols in XML?转义 XML 中的特殊字符/符号?
【发布时间】:2014-02-21 14:52:27
【问题描述】:

在我的数据库中使用表创建 XML 时,我得到了许多特殊字符,如注册商标、商标、学位、不同的标点符号等(这些以符号形式、十六进制、名称代码、数字代码存在)... .其他一些词,如 、°、...

还有一些字符在我的 XML 中显示为 x99、xEA 等。

在使用 JAVA 代码创建 XML 时,是否有一个库/API 可以处理所有这些问题。 我正在为我的 XML 使用“UTF-8”字符编码。

我也无法清理我的数据库以获得一致的数据,因为它是生产数据。

【问题讨论】:

  • 您应该只将数据提供给 XML API,它会根据需要转义和取消转义。
  • StringUtils.escapeXml()

标签: java xml set character


【解决方案1】:

一个可能的选择是将您的数据包含在CDATA 标记中,这会将数据标记为可能包含标记的字符数据,但不应这样处理。

【讨论】:

    【解决方案2】:

    free command line tool 用于将文本中带有特殊字符的文件转换为有效的 XML。它还确保文件编码与声明中指定的匹配。

    还有一个 Java 开发人员套件,允许您使用解析器来解析此类文件(称为 XPL),作为 XML 的替代方案或对 XML 的预处理。它使用称为 StAX-PL 的类似 StAX 的过程。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-12-14
      • 1970-01-01
      • 2019-05-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多