【发布时间】:2019-01-24 11:17:43
【问题描述】:
我正在尝试编写一个正则表达式来查找句子中的重复单词。 好吧,我尝试使用这个表达式:
\b(\w+)\b.*?\1
从句子"Hello how in the Hello world are you ? are you okay? Hello" 中选择 3x 'hello'、2x 'are' 和 2x 'you',我知道这显然是错误的,因为它考虑了整个单词组而不是一个特定的单词!
那么您能纠正我的表达方式或提出您自己的解决方案吗?
我正在使用Matcher 类尝试使用matcher.find() 的while 循环中的计数变量找出给定单词的出现次数。
【问题讨论】:
-
简单地分割每个空格然后将所有项目放在
Multiset/CountedSet/CountingSet中会更容易。