【发布时间】:2011-03-09 02:07:20
【问题描述】:
我将构建一个可供欧洲各地人们使用的应用程序。我需要知道哪种排序规则和字符集最适合用户输入的数据。或者我应该为每种语言制作一个单独的表格。一篇解释这一点的文章会很棒。
谢谢:)
【问题讨论】:
我将构建一个可供欧洲各地人们使用的应用程序。我需要知道哪种排序规则和字符集最适合用户输入的数据。或者我应该为每种语言制作一个单独的表格。一篇解释这一点的文章会很棒。
谢谢:)
【问题讨论】:
字符集,毫无疑问,UTF-8。整理,我不确定是否有一个好的答案,但您可能想阅读this report。
【讨论】:
È > E)还是被视为单独的实体。
Unicode 是一个非常大的字符集,包括几乎所有语言的几乎所有字符。
有多种方法可以将 Unicode 文本存储为字节序列 - 这些方法称为 编码。所有 Unicode 编码(嗯,所有完整的 Unicode 编码)都可以将所有 Unicode 文本以某种格式存储为字节序列 - 但任何给定文本占用的字节数将取决于所使用的编码。
UTF-8 是一种 Unicode 编码,针对英语和其他使用拉丁字母表之外的字符很少的语言进行了优化。 UTF-16 是一种 Unicode 编码,可能更适合各种欧洲语言的文本。 Java 和 .NET 将内存中的所有文本(String 类)存储为 UTF-16 编码的 Unicode。
【讨论】:
CHARACTER SET 选项添加什么。如果你输入UTF8,MySQL 会正确地假设你的意思是 Unicode 集,UTF-8 编码。