【发布时间】:2019-09-27 07:38:28
【问题描述】:
我有这个正则表达式:
(\s+)|([.,!?:;'\"\'-])
这与数组中的任何空格或标点符号匹配,但不是所有标点符号,我正在努力寻找与任何标点符号匹配的示例。
我考虑过匹配字符不是字母数字的位置,但这会导致重音字母和不同词典出现问题。
标点符号是否包含所有内容,例如(当我说标点符号时我希望包含符号):
`,.#@
等等
【问题讨论】:
-
这是一本综合指南。跟随它,您将能够自己构建它:p itnext.io/…
-
只在你的角色类中包含额外的角色。
-
见Supported Unicode General Categories和下面支持的命名块。
-
您可能需要先进行文本规范化。请参阅String.Normalize 方法。另见Unicode equivalence、Normalization FAQ