【发布时间】:2012-01-27 16:23:24
【问题描述】:
如果我在 ansi xml 文件中放入一个 utf8 字符 » 并尝试使用 SAXParser 解析它,那么它会被解析而没有任何错误。为什么它没有抛出任何异常?
示例 xml 文件。将其保存为 ansi 编码。 Chrome 无法打开文件,但 saxparser 解析它没有错误。
<?xml version="1.0" encoding="UTF-8"?>
<root date="2010-06-17">
<product
id="1 "
label= « xyz"/>
</root>
w3c xml validator 也无法查看此文档。
【问题讨论】:
-
如果 UTF-8 流损坏,应该会出现错误。简洁完整的代码示例?
-
"ANSI" 作为一个字符编码的名字已经很过时了!我认为微软在 1980 年代开始使用这个名称来表示 iso-8859-1,因为这是他们遇到的唯一 ANSI 标准。当然,他们还生产了自己的专有变体,最好称为 CP1252。