【问题标题】:difference between iso-8859 and iso-8859-1,iso-8859 和 iso-8859-1 之间的区别,
【发布时间】:2011-06-10 08:03:57
【问题描述】:

iso-8859是否支持拉丁字符我需要在java程序中使用iso-8859-1来读取中文文件,这有什么区别

【问题讨论】:

    标签: iso


    【解决方案1】:

    ISO-8859 是 8 位字符编码的标准。 8 位为您提供 256 种组合,这对于拉丁字母的大多数扩展都可以,但对于中文字符则不行。

    ISO-8859-1 是 ISO-8859 的“版本”之一,支持大多数西欧语言(法语、德语、西班牙语……)。对于中欧语言(波兰语、捷克语、斯洛伐克语...),您需要 ISO-8859-2 等。

    ISO-8859-1 和 ISO-8859-2 之间的不同点之一是 ISO-8859-1 中的法语字母 è,与捷克/斯洛伐克语字母 č 在相同的位置ISO-8859-2。这就是为什么你不能将这两个字母组合成一个文本。

    现在使用 Unicode 也可以组合汉字。

    【讨论】:

    • 感谢您的回复,所以如果我需要使用我需要使用的 iso 的汉字
    • 顺便说一句,ISO 8859-1 的替代标准是 ISO 8859-15,它几乎与 -1 相同,但包括欧元符号(和一些小变音符号)。
    • 如果您绝对需要 ISO 编号,请搜索 ISO 10646。
    • @vijay:中文字符没有 ISO 8859 代码页,因为 8859 只能为标准 ASCII 集提供 128 个附加字符……但是中文字符集超过了几千个“字符”。为此使用 Unicode 变体(UTF-8、UTF-16、UTF-32)。
    【解决方案2】:

    有几种可用于中文的编码(例如简体和繁体)。看 http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html 获取列表。 最常见的是GB2312 aka EUC_CN 用于简体中文和Big5 用于繁体中文。我也看过UTF-8代表的中文文档。

    【讨论】:

      猜你喜欢
      • 2015-10-11
      • 1970-01-01
      • 2012-03-09
      • 2013-01-19
      • 2012-05-25
      • 2011-02-12
      • 1970-01-01
      • 2020-11-22
      相关资源
      最近更新 更多