【发布时间】:2018-01-06 13:05:12
【问题描述】:
我正在尝试拆分小写字母后跟大写字母的文本。
假设文本是:
"Įvairių rūšiųSkinti kardeliai"
我想在“ųS”处拆分它,但下面的正则表达式“[ą-ž][Ą-Ž]”给了我:
"Įvairių r"
但是当我将母语字母和正则表达式更改为“[a-z][A-Z]”时
"Ivairiu rusiuSkinti kardeliai"
我得到了预期的结果:
"Ivairiu rusi"
【问题讨论】:
-
我会选择字符类,所以你只需要说“小写后跟大写”,只要正则表达式引擎正确处理它们(我会假设 Java 会这样)。例如,由于 Unicode 点范围 ą-ž 不包括 a-z,因此它与常规拉丁字母不匹配
-
添加您正在使用的实际代码将使回答问题更容易