IKAnalyzer分词是一个开源的,基于java语言开发的轻量级的中文分词工具包。IKAnalyzer采用“正向迭代最细粒度切分算法”,支持细粒度和智能分词两种模式。支持用户字典扩展定义,不过对中英文混合词的分割没有特别好的支持。


1、下载IKAnalyzer中文分词器http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

2、解压出zip文件,将IKAnalyzer2012FF_u1.jar复制到tomcat中的solr\WEB-INF\lib目录中

3、在tomcat的solr\WEB-INF目录中,新建一个classes文件夹,将解压出的zip文件中的IKAnalyzer.cfg.xml和stopword.dic复制到classes中

4、用记事本打开E:\solrhome\5.2.1\core0\conf\schema.xml文件,加入这句话到<schema/>节点内:

<fieldType name="text_cn" class="solr.TextField">
        <analyzer type="index" class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

<field name="subject" type="text_cn" indexed="true" stored="true" />
<field name="content" type="text_cn" indexed="true" stored="true" />

 

5、启动或重启tomcat

6、进入http://localhost:8082/solr5.2.1/#/core1/analysis,输入“我是中国人,我来自张家界”。

[solr] - IKAnalyzer 分词加入

 

相关文章:

  • 2021-05-26
  • 2022-12-23
  • 2021-12-09
  • 2021-07-08
  • 2021-11-17
  • 2022-12-23
猜你喜欢
  • 2021-08-15
  • 2021-11-29
  • 2021-06-14
  • 2022-01-17
  • 2021-11-15
  • 2021-05-03
  • 2021-10-08
相关资源
相似解决方案