【发布时间】:2010-11-16 17:32:00
【问题描述】:
我得到了一个 XML 文件,其中包含来自法语的 utf-8 字符串。部分消息如下:
“N'oubliez pas d'écrire le nom exact de le professeur, sans utiliser des abréviations”
如您所见,重音符号失败了。我尝试使用 iconv 转换文件,但似乎不被识别为 UTF-8(当文件使用该字符集时)。我能做什么?
谢谢!
【问题讨论】:
-
你还没有说你在解码后对文件做了什么 - 例如。您是否正在显示它(以及如何),将其转换为不同的编码等。
-
我打赌这个文件使用 ISO-8859-1 编码,所以使用这个编码来正确读取它。
-
这看起来与读取到 ANSI 编码字符串的 UTF-8 编码文件完全一样。请阅读指定正确字符集的文件...
-
@Paweł:没有“ANSI”这样的东西。然而,它看起来确实像 UTF-8 被误解为 ISO 8859-1。