【问题标题】:UTF8 encoding unable to decodeUTF8编码无法解码
【发布时间】:2010-11-16 17:32:00
【问题描述】:

我得到了一个 XML 文件,其中包含来自法语的 utf-8 字符串。部分消息如下:

“N'oubliez pas d'écrire le nom exact de le professeur, sans utiliser des abréviations”

如您所见,重音符号失败了。我尝试使用 iconv 转换文件,但似乎不被识别为 UTF-8(当文件使用该字符集时)。我能做什么?

谢谢!

【问题讨论】:

  • 你还没有说你在解码后对文件做了什么 - 例如。您是否正在显示它(以及如何),将其转换为不同的编码等。
  • 我打赌这个文件使用 ISO-8859-1 编码,所以使用这个编码来正确读取它。
  • 这看起来与读取到 ANSI 编码字符串的 UTF-8 编码文件完全一样。请阅读指定正确字符集的文件...
  • @Paweł:没有“ANSI”这样的东西。然而,它看起来确实像 UTF-8 被误解为 ISO 8859-1。

标签: encoding utf-8 iconv


【解决方案1】:

尝试在 Windows 记事本中打开文件并查看其外观。如果看起来不错,那么问题可能出在其他地方(例如,您是否将数据发送到浏览器而不指定 UTF-8?)。

如果在记事本中看起来也有问题,请尝试以下操作(我将您的数据复制到一个文件中,并且能够通过这样做“修复”它):

  • 在记事本中打开
  • 文件 -> 另存为 -> 选择“ANSI”并保存
  • 在记事本中打开新文件
  • 文件 -> 另存为 -> 选择 UTF-8 并保存

这个最终文件应该在记事本中正确打开,并被编码为带有三字节 UTF-8 签名的 UTF-8。

【讨论】:

    猜你喜欢
    • 2014-06-23
    • 1970-01-01
    • 2016-08-03
    • 2012-08-08
    • 1970-01-01
    • 1970-01-01
    • 2019-03-13
    • 2012-09-10
    相关资源
    最近更新 更多