【问题标题】:How to unescape non-standard characters in XML in Java?如何在 Java 中对 XML 中的非标准字符进行转义?
【发布时间】:2011-08-26 03:30:12
【问题描述】:

我意识到以前有人问过类似的问题,解决方案是使用StringEscapeUtils.unescape()。但是,根据方法描述:

仅支持五种基本 XML 实体(gt、lt、quot、amp、apos)。 不支持 DTD 或外部 实体。

我有一堆带有转义字符的 XML 文件,例如 ␣&hyph;。我怎样才能摆脱这些?它们在提供的 DTD 中定义。是否有类似 StringEscapeUtils 但支持 DTD 的方法?

【问题讨论】:

    标签: java xml xml-parsing


    【解决方案1】:

    嗯,已经很久了,但我认为EntityResolver2(Java SDK)的实现可以处理外部定义的实体。这是 SAX2 规范的一部分。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-05-29
      • 2012-11-10
      • 2017-02-01
      • 2012-08-30
      相关资源
      最近更新 更多