【发布时间】:2013-02-21 16:10:31
【问题描述】:
我在“现实生活”中遇到COMBINING LATIN SMALL LETTER C (U+0368) 的可能性有多大(clever Scottish folk 除外)?
我在问,因为它在 Unicode Block Combining Diacritical Marks 和 Category Mark, Nonspacing [Mn] 中。
因此,它似乎被 ICU Transliterator 等实用程序视为与 COMBINING GRAVE ACCENT (U+0300) 等字符相同的字符(使用建议的 "NFD; [:Nonspacing Mark:] Remove; NFC" 或直接的 "Latin-ASCII" 音译)。
【问题讨论】:
-
考虑到分类,ICU 的行为似乎是合适的——角色是另一个角色的装饰,另一个角色是主要角色。任何其他用法(例如您聪明的苏格兰语)都是滥用行为,不应期望产生合理的结果。
-
在中世纪的德语文本中并不少见。好吧,如果你不支持它,作者不会不高兴;)