【发布时间】:2014-03-24 23:12:03
【问题描述】:
当使用空格标记器时,会出现“there, he is”之类的文本。将被拆分为 “那里”、“他”和“是”。当然,我想删除那些标准标记器会自动删除的标点符号。
我的问题是:
- 如何修剪那些标点符号? (在 elasticsearch 设置中,例如添加另一个令牌过滤器或字符过滤器)
- 我需要使用空白标记器,主要是因为我不希望连字符的单词被拆分。有没有办法在仍然使用标准标记器的同时实现这一目标?
【问题讨论】:
标签: elasticsearch