【发布时间】:2012-05-22 10:04:57
【问题描述】:
可能重复:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n or Remove diacritical marks from unicode chars
如何从字符串中删除变音符号?
例如转换所有适用于所有语言的 á->a、č->c 等。
我正在进行全文搜索,需要忽略搜索文本上的任何变音符号。
谢谢
【问题讨论】:
-
this 有帮助吗?
可能重复:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n or Remove diacritical marks from unicode chars
如何从字符串中删除变音符号?
例如转换所有适用于所有语言的 á->a、č->c 等。
我正在进行全文搜索,需要忽略搜索文本上的任何变音符号。
谢谢
【问题讨论】:
使用 API 级别 9+,您可以使用 Normalizer 类,例如
String normalized = Normalizer.normalize("âbĉdêéè", Form.NFD)
.replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
(Keysers 链接的答案看起来更好,它清除了更多废话)
这将返回"abcdeee"。
【讨论】: