【问题标题】:Java : Remove strange special characters from String [duplicate]Java:从字符串中删除奇怪的特殊字符[重复]
【发布时间】:2016-06-13 16:54:47
【问题描述】:

我想从 Java 中的字符串中删除所有奇怪的特殊字符。 那些奇怪的特殊字符在 MS Word 中以 ?(问号)的形式出现。示例字符串的图像如下所示。

【问题讨论】:

  • 了解 Unicode 和 UTF-8。
  • 顺便说一句,定义奇怪。是否要删除所有非 ASCII 字符?
  • 那些没有被 textToConvert.replaceAll("[^\\x00-\\x7F]", "") 删除的字符
  • 然后使用:textToConvert.replaceAll("[\\x00-\\x7F]", "") 我没有看到你的问题。

标签: java


【解决方案1】:

你可以使用

String newString = my_string.replaceAll("\\p{C}", "");

有关 Java Unicode 正则表达式Java Unicode Regular expression here的更多信息

【讨论】:

  • 我建议 .replaceAll("[!@#$%^&*/\(\)\\{\\};:/?,.|\[\]]", " ");它会为其他语言保留 é, á,çã
【解决方案2】:

这将起作用:

String string = yourString.replaceAll("[^\\x00-\\x7F]", "");

【讨论】:

    猜你喜欢
    • 2014-05-20
    • 2020-11-19
    • 2012-12-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-12-22
    • 2011-04-11
    • 2016-01-23
    相关资源
    最近更新 更多