【发布时间】:2011-06-10 08:03:57
【问题描述】:
iso-8859是否支持拉丁字符我需要在java程序中使用iso-8859-1来读取中文文件,这有什么区别
【问题讨论】:
标签: iso
iso-8859是否支持拉丁字符我需要在java程序中使用iso-8859-1来读取中文文件,这有什么区别
【问题讨论】:
标签: iso
ISO-8859 是 8 位字符编码的标准。 8 位为您提供 256 种组合,这对于拉丁字母的大多数扩展都可以,但对于中文字符则不行。
ISO-8859-1 是 ISO-8859 的“版本”之一,支持大多数西欧语言(法语、德语、西班牙语……)。对于中欧语言(波兰语、捷克语、斯洛伐克语...),您需要 ISO-8859-2 等。
ISO-8859-1 和 ISO-8859-2 之间的不同点之一是 ISO-8859-1 中的法语字母 è,与捷克/斯洛伐克语字母 č 在相同的位置ISO-8859-2。这就是为什么你不能将这两个字母组合成一个文本。
现在使用 Unicode 也可以组合汉字。
【讨论】:
有几种可用于中文的编码(例如简体和繁体)。看
http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html 获取列表。
最常见的是GB2312 aka EUC_CN 用于简体中文和Big5 用于繁体中文。我也看过UTF-8代表的中文文档。
【讨论】: