【发布时间】:2015-03-25 12:35:23
【问题描述】:
我需要将句子拆分为单词和标点符号,并将它们放入列表中,保存它们的顺序。
例如: "Some text here!"。结果应该是:List(Some, ,text, , here,!)
我正在使用String.split("regex"); 使用“split”我可以仅按单词或仅按标点符号拆分文本。
那么我应该使用什么来同时按单词和标点符号分割文本? 提前谢谢你。
【问题讨论】:
-
如果有一些数字怎么办? ..
some text2 here! 4 you? -
数字属于单词。这就像从非单词字符中拆分单词。
-
现在我只能将字符串拆分为单词并将它们添加到列表中。像 String[] words = sentenseToParse.split(regex);但我还需要从同一个字符串(包括空格)中获取非单词字符,如 !@#$。并将 em 放到 String[] sentenseParts 中。它应该像 {word, space, another word, dot}
标签: java regex parsing text split