使用空格标记器时删除逗号答案

【问题标题】：Removing commas when using whitespace tokenizer使用空格标记器时删除逗号
【发布时间】：2014-03-24 23:12:03
【问题描述】：

当使用空格标记器时，会出现“there, he is”之类的文本。将被拆分为 “那里”、“他”和“是”。当然，我想删除那些标准标记器会自动删除的标点符号。

我的问题是：

【问题讨论】：

【解决方案1】：

您可以使用 char 过滤器来删除“，”。 Char Filter

【讨论】：

【解决方案2】：

你可以使用：

我已经安装的一个片段̶=̶>̶HTTP：̶/̶/̶e̶s̶.̶s̶u̶b̶i̶t̶o̶l̶a̶b̶s̶.̶c̶o̶m̶/̶＃̶/̶t̶e̶s̶t̶r̶/̶m̶6̶m̶f̶b̶4̶a̶h̶i̶m̶8̶6̶w̶2̶9̶ P>

【讨论】：

【解决方案3】：

您可以使用 split() 删除所有标点符号

String str ="there, he is.";
String[] ss = str.split("[ ,.]");   
for (String string : ss) {
System.out.println(string);
}

试试这个这将帮助你

【讨论】：