【发布时间】:2009-10-25 12:16:40
【问题描述】:
如何在 Ruby 中按 Unicode 范围 拆分字符串。我想用逗号分隔 \u1000 和 \u1000 以上。比如我想拆分这个字符串...
我爱မြန်မာ
到这个...
我爱,မြန်မာ
在我的示例中,您可能看不到 Unicode 字符。它是 Unicode 范围 \u1000 及以上。
谢谢。
【问题讨论】:
如何在 Ruby 中按 Unicode 范围 拆分字符串。我想用逗号分隔 \u1000 和 \u1000 以上。比如我想拆分这个字符串...
我爱မြန်မာ
到这个...
我爱,မြန်မာ
在我的示例中,您可能看不到 Unicode 字符。它是 Unicode 范围 \u1000 及以上。
谢谢。
【问题讨论】:
取决于您使用的版本;这是1.9的解决方案。我想 1.8 可能会变得丑陋。
这取决于优雅,但似乎有效。
"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2')
如果此方法适用,则必须提供另一种情况(从高到低的转换)
【讨论】: