【问题标题】:Where to get UTF-8 charset [closed]从哪里获得 UTF-8 字符集 [关闭]
【发布时间】:2012-01-04 17:44:26
【问题描述】:

我需要从一些授权位置获取 UTF-8 字符集的完整列表。

我试过查看 Unicode.org 但没有信息。

【问题讨论】:

  • “UTF-8 字符集”确切是什么意思? UTF-8 是一种编码 - 用于将 Unicode 字符表示为字节序列。
  • 请阅读维基百科:en.wikipedia.org/wiki/UTF-8

标签: unicode utf-8


【解决方案1】:

UTF-8 中可表示的字符集与 Unicode 字符集完全相同。

授权机构是 Unicode 联盟。如果您特别想要一个列表,那么您可以访问链接到 Unicode 字符数据库的 http://www.unicode.org/ucd/,其中包含大列表 http://www.unicode.org/Public/UNIDATA/UnicodeData.txt。但是,它不是一个完全明确的列表,因为一些宽范围仅表示为范围,例如

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;

这意味着从 AC00 到 D7A3 的字符都被定义为韩文音节字符(名称由算法构造)。

【讨论】:

【解决方案2】:

这可以帮助你:http://www.utf8-chartable.de/

或者也许是这个: http://www.unicode.org/charts/charindex.html

【讨论】:

  • 我找到了,但是这是标准权威吗?
  • 我不这么认为,但我直接从 unicode.org 添加了第二个链接
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2011-10-05
  • 2014-01-13
  • 1970-01-01
  • 2012-01-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多