【发布时间】:2012-01-04 17:44:26
【问题描述】:
我需要从一些授权位置获取 UTF-8 字符集的完整列表。
我试过查看 Unicode.org 但没有信息。
【问题讨论】:
-
“UTF-8 字符集”确切是什么意思? UTF-8 是一种编码 - 用于将 Unicode 字符表示为字节序列。
-
请阅读维基百科:en.wikipedia.org/wiki/UTF-8
我需要从一些授权位置获取 UTF-8 字符集的完整列表。
我试过查看 Unicode.org 但没有信息。
【问题讨论】:
UTF-8 中可表示的字符集与 Unicode 字符集完全相同。
授权机构是 Unicode 联盟。如果您特别想要一个列表,那么您可以访问链接到 Unicode 字符数据库的 http://www.unicode.org/ucd/,其中包含大列表 http://www.unicode.org/Public/UNIDATA/UnicodeData.txt。但是,它不是一个完全明确的列表,因为一些宽范围仅表示为范围,例如
AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;
这意味着从 AC00 到 D7A3 的字符都被定义为韩文音节字符(名称由算法构造)。
【讨论】:
【讨论】: