【发布时间】:2012-12-03 09:53:08
【问题描述】:
在记事本中将文本文件另存为“Unicode”是什么意思?是 Utf-8、Utf-16 还是 Utf-32?提前致谢。
【问题讨论】:
-
可能是 UTF-8,因为这是最常见的。
-
@Linuxios,但是在记事本保存文件中还有一个名为 Utf-8 的选择!!怎么可能被复制??
在记事本中将文本文件另存为“Unicode”是什么意思?是 Utf-8、Utf-16 还是 Utf-32?提前致谢。
【问题讨论】:
在记事本中,与一般的 Windows 软件一样,“Unicode”作为编码名称表示 UTF-16 Little Endian (UTF-16LE)。 (我一开始以为它不是真正的UTF-16,因为Notepad++将其识别为UCS-2并将内容显示为垃圾,但用BabelPad重新检查,我得出结论,Notepad甚至可以正确编码非BMP字符。)
同样,“Unicode 大端”表示 UTF-16 大端。而“ANSI”是指系统的原生传统编码,例如西方版本 Windows 中的 8 位 windows-1252 编码。
【讨论】:
所有这些格式都是“Unicode”。但通常 Mac 和 Windows 上的编辑器表示 UTF-8,因为它在代码 128 IIRC 以下与 ASCII 兼容。 UTF-8 可以通过使用特殊字符来表示比 256(适合 8 位的单个字节)更多的代码,这意味着后面的字节也属于同一个字符。
如果您查看终端中的输出,例如使用 vi,并且如果您看到每两个字符之间有一个空格,那么您正在查看 UTF-16,因为每两个字节构成一个字符。您应该看到的是字符之间没有空格,这是 UTF-8 的指示。
【讨论】: