汉字常见字符集
- GB2312
中国标准简体字符集,通行于中国大陆,中国大陆几乎所有的中文系统和国际化的软件都支持GB2312
- GBK
汉字内码扩展规范,在GB2312的基础上做了扩充,且对GB2312完全兼容,GBK不是国家标准是行业标准
国际编码 UTF-8
是一种针对 Unicode的可变长度字符编码,通用性很好
可以表示中文、英文、韩语、日语...
常用字符集比较
- ACSII:单字节7位编码,C,Java等编程里常用的那些
- GBK:占2个字节,是固定的
- UTF-8:1~4字节编码,是互联网、Linux广泛支持的字符集,其中汉字编码需要3个字节
MySQL支持的字符集
- 查看所有可用的字符集
show character set;
- MySQL的字符集包括字符集(character)和校对规则( collation)两个概念
- 字符集用来定义MySQL存储字符串的方式
- 校对规则用来定义字符串的比较方式
- 字符集和校对规则是一对多的关系,一个字符集有多个校对规则,校对规则命名约定:它们以相关的字符集名开始,通常包括一个语言名,并且以 _ci(忽略大小写)、_cs(区分大小写)、_bin(二元)比较基于字符编码的值与language无关 结束
查看字符集的校对规则:
show collation like '字符集前缀%';
列出了所有的校对规则