【问题标题】:Collation STRENGTH and local language relation校对 STRENGTH 和本地语言关系
【发布时间】:2011-04-13 23:45:52
【问题描述】:

我从 Collat​​or 的 Javadoc 中阅读了以下内容。

“对语言特征的精确分配取决于语言环境。例如,在捷克语中,“e”和“f”被认为是主要差异,而“e”和“ê”是次要差异,“e”和“E”是三级差异,“e”和“e”是相同的。”

这是否意味着我应该根据我使用的语言设置 STRENGTH?如果是这样,有人可以建议语言环境的默认值:us_en、us_es、ca_fr、spain_spanish、chile_spanish、portuguese

【问题讨论】:

    标签: localization internationalization collation


    【解决方案1】:

    真的取决于你想要做什么。对于大多数(所有?)使用拉丁字母的语言来说,以下情况是正确的:

    • 初级
      • 不同:a、á、Á、b
      • 相同:á, Ⅴ
      • 相同:a,A
    • 次要
      • 不同:a、á、Á、b
      • 不同:á, Ⅵ
      • 相同:a,A
    • 三级
      • 不同:a、á、Á、b
      • 不同:á, Ⅵ
      • 不同:a、a
    • 相同
      • 还要考虑您看不到的差异,例如(accented A)(A) + (accent) 之间的差异

    语言之间会有细微的差异,但本质上是:

    • 如果您需要区分大小写的比较,请使用 Tertiary。
    • 对于不区分大小写的比较,请使用 Primary 或 Secondary,具体取决于您是否希望 á 与 â 分组。
    • 有些排序规则很奇怪。 a 与 á 不同,即使在 Primary 中,á 也与 Á 不同,即使在 Primary/Secondary 中。我不知道为什么;可能是错误?
    • 谁知道非拉丁语言会发生什么。

    【讨论】:

    • 值得注意的是排序规则如何影响零宽度空间、单词连接器/非连接器、软连字符
    猜你喜欢
    • 2013-10-25
    • 1970-01-01
    • 2010-11-18
    • 1970-01-01
    • 1970-01-01
    • 2019-10-04
    • 1970-01-01
    • 2014-02-04
    • 2012-10-08
    相关资源
    最近更新 更多