【问题标题】:What's the difference between GC=Mark and GC=Punctuation in Unicode general categories?Unicode 通用类别中的 GC=Mark 和 GC=Punctuation 有什么区别?
【发布时间】:2012-05-21 05:02:54
【问题描述】:
我无法理解某些概念。在 Unicode 规范中,有一个名为 general category 的属性。
好的,我了解了字母(常用字符;GC=L)、数字(如数字 0-9 和其他具有数值的字符;GC=N)和分隔符(分隔符;GC=Z)的含义。但是很难区分符号 (GC=S)、标点符号 (GC=P) 和标记 (GC=M)。
我查找了它们的列表,但找不到概念上的差异。而且这份文件对我帮助不大。所有这些有什么区别?
【问题讨论】:
标签:
unicode
symbols
punctuation
character-properties
【解决方案1】:
标记不是独立的字符,而是应用于另一个字符。非间距标记显示在目标字符上,间距标记显示在目标字符上,封闭标记显示在目标字符周围。例如,这是一个盒子中的 a(字符“a”与封闭的方形字符组合):
⃞
关于标点符号与符号:正如您链接的文本所解释的那样,某些极端情况的分类相当随意,但原则上的区别在于标点符号用于“组织和分隔文本单元”(即标记句子的结尾,分隔句子的不同部分,分隔枚举的元素等)和“表示概念”的符号(例如单位或数学符号)。