【发布时间】:2012-10-03 14:09:30
【问题描述】:
我对 Java 比较陌生,我需要一些帮助才能从字符串中提取多个子字符串。字符串示例如下:
String = "How/WRB can/MD I/PRP find/VB a/DT list/NN of/IN celebrities/NNS '/POS real/JJ names/NNS ?/."
想要的结果:WRB MD PRP VB DT NN IN NNS POS JJ NNS
我有一个文本文件,其中可能包含数千个类似的带有 POS 标记的行,我需要从中提取 POS 标签并根据 POS 标签进行一些计算。
我尝试过使用分词器,但并没有真正得到我想要的结果。我什至尝试使用split() 并保存到数组,因为我需要存储它并稍后使用它,但仍然没有用。
最后,我尝试使用模式匹配器,但正则表达式出现问题,因为它返回带有正斜杠的单词。
Regex: [\/](.*?)\s\b
Result: /WRB /MD ....
如果有更好的方法可以做到这一点,请告诉我,或者是否有人可以帮助我找出我的正则表达式有什么问题。
【问题讨论】:
-
使用
split()函数!!你用谷歌搜索够了吗? -
您的正则表达式看起来不错,您确定从匹配器中检索到正确的组吗?看起来您打印第 0 组,而您需要第 1 组(包含括号内的内容)