【发布时间】:2015-05-17 10:42:37
【问题描述】:
如何根据字符集作为分隔符将文本拆分为句子?
我有一个功能,用户将在其中输入文本和分隔符。分隔符可以是单个字符或字符串(用户可以指定 'xyz' 作为分隔符)。
我努力了
StringTokenizer(text, delimiter) 只接受字符作为分隔符。下一个选项是
String.split() 但是当我给出诸如'**'之类的分隔符时这会失败。它需要将“\”附加到分隔符。
附加“\”看起来很乏味,因为如果分隔符是“**”,那么我必须将其更改为“\*\*”。如果分隔符是“”,那么我拆分函数看起来像 String [] sentences = text.split("\\<TAB\\>");
是否有任何简单的方法可以将文本拆分为基于字符集作为分隔符的句子?
【问题讨论】:
-
StringTokenizer(String, String)不仅接受单个字符作为分隔符,还接受String。