【发布时间】:2026-01-15 23:05:01
【问题描述】:
我正在查看某人之前提出的this 问题的答案,我发现它们非常有帮助。但是,我对highlighted 的答案有疑问,但我不确定我是否应该在那里问,因为它是一个 6 岁的线程。
我的问题是关于答案中给出的这个 sn-p 代码:
private static boolean isAWord(String token)
{
//check if the token is a word
}
你将如何检查令牌是否是一个单词?你会.contains("\\s+") 字符串并检查它们之间是否包含字符吗?但是当你遇到一个段落怎么办?我不知道该怎么做。
编辑:我想我应该详细说明一下。通常,您会认为单词会被 " " 包围,但是,例如,如果文件包含连字符(也被空格包围),您会希望 isAWord() 方法返回 false。如何验证某些内容实际上是单词而不是标点符号?
【问题讨论】:
-
嗯,这取决于我认为的“单词”的定义。也许
token.matches("\\w+")如果这个词应该只包含字母token.matches("[A-Za-z]+")但这不会匹配变音符号和其他非ASCII字母