【发布时间】:2011-09-06 03:20:36
【问题描述】:
以下内容将替换 ASCII 控制字符([\x00-\x1F\x7F] 的简写):
my_string.replaceAll("\\p{Cntrl}", "?");
以下内容将替换所有 ASCII 不可打印字符([\p{Graph}\x20] 的简写),包括重音字符:
my_string.replaceAll("[^\\p{Print}]", "?");
但是,它们都不适用于 Unicode 字符串。有没有人有从 unicode 字符串中删除不可打印字符的好方法?
【问题讨论】:
-
作为附录:Unicode 通用类别列表可以在UAX #44中找到
-
@Stewart:嗨,除了标题,你看过问题/答案了吗?!?
-
@Stewart:其他问题仅涵盖不可打印字符的 ascii 子集!!!