查询Java中的trim()方法答案

【问题标题】：Query about the trim() method in Java查询Java中的trim()方法
【发布时间】：2012-09-02 20:26:49
【问题描述】：

我之前提出了一个问题，但遭到了严厉的批评，所以我在这里再次提出。更简单，并改写为吸引那些可能担心我之前提出问题的人。

背景我正在解析一些 HTML 以获取信息。我已经将所有内容隔离在一系列行中，但我希望抓取的内容和后面的一堆空格。为了摆脱空格，我选择使用 trim()，但我遇到了麻烦。我的代码的最后几行是测试：

System.out.println("'" + someString + "'\n'" + someString.trim() + "'");

结果是：

'Sophomore                                          '
'Sophomore                                          '

我担心我调用 trim() 的方式可能有问题，因为我们都会不时犯错，所以我这样测试：

String s = "   hello         ";
System.out.println("'" + s+ "'\n'" + s.trim() + "'");

结果是：

'  hello     '
'hello'

我的问题我究竟做错了什么？我想要的是'大二'，而不是'大二' '

期待您的出色回答（提前致谢！）。

【问题讨论】：

【解决方案1】：

String.trim()specifically only removes 代码超过\u0020 的第一个字符之前和最后一个这样的字符之后的字符。

这不足以删除所有个可能的空白字符 - Unicode 定义了更多（代码点高于\u0020）将不会被.trim() 匹配。

也许您的空白字符不是您认为的那些？

EDIT cmets 透露，额外的字符确实是“特殊”空白字符，特别是 \u00a0，它是一个 Unicode“不间断空格”。要将那些替换为普通空格，请使用：

str = str.replace('\u00a0', ' ');

【讨论】：

【解决方案2】：

源字符串中必须有一个非空白字符。将以下内容添加到您的代码中，看看它会打印什么。

for (char ch : someString.toCharArray()) {
     System.out.print(Integer.toHexString(ch) + " ");
}

【讨论】：