(solr系列:三)如何在solr中添加ik分词器

简介:

 分词技术是搜索技术里面的一块基石。很多人用过,如果你只是为了简单快速地搭一个搜索引擎,你确实不用了解太深。但一旦涉及效果问题,分词器上就可以做很多文章。例如, 在我们实际用作电商领域的搜索的工作中,类目预判的实现就极须依赖分词,至少需要做到可以对分词器动态加规则。再一个简单的例子,如果你的优化方法就是对不同的词分权重,提高一些重点词的权重的话,你就需要依赖并理解分词器。

   下面将介绍如何在solr中为core:simple的title添加分词,承接上一篇博文(http://simplelife.blog.51cto.com/9954761/1864073 ),

启动tomcat,浏览器中访问:localhost:8080/solr


wKiom1gI6p-yVuwLAAJJPyzCs84257.png如图,点击collection1中的Analysis,在Field Value (Index)中输入:我爱北京天安门,并选择Analyse Fieldname / FieldType为:title

wKiom1gI647ggzs8AALNLsEwfMA590.png

我们知道,我是没有对默认的core:collection1的title做分词的,所以当我输入一句话时并不会被分词。

下面我就为自定义这个core:simple的标题做分词,看看做完分词之后搜索的效果是什么……敬请期待!

========================================================================================

1、下载ik分词器的jar包:http://pan.baidu.com/s/1eScBIJC 

2、将下载下来的jar包复制到apache-tomcat-7.0.72\webapps\solr\WEB-INF\lib中

3、在solrhome\simple\conf下的schema.xml文件中添加fieldType:

1
2
3
< fieldType  name = "text_ik"  class = "solr.TextField" >   
      < analyzer  class = "org.wltea.analyzer.lucene.IKAnalyzer" />   
</ fieldType >

然后将field中name="title"的type修改成text_ik,如下图:

wKioL1gI7WjyEalWAABmBSvrte8945.png

4、重启tomcat,浏览器中访问:localhost:8080/solr, 选择simple-->Analysis,重新上面的操作看效果:

wKiom1gI7majO-NMAAJJg6Hlzvg305.png

如果做到这,那么恭喜你,完成了solr中ik分词器的使用。


本文转自 兴趣e族 51CTO博客,原文链接:http://blog.51cto.com/simplelife/1864080


相关文章
|
8月前
|
自然语言处理 关系型数据库 MySQL
|
10月前
|
JSON 自然语言处理 数据格式
ElasticSearch用ik_analyzer分词器出现报错
ElasticSearch用ik_analyzer分词器出现报错
151 0
|
11月前
|
Java Maven 开发工具
【ElasticSearch 】IK 分词器安装
【ElasticSearch 】IK 分词器安装
|
自然语言处理 算法 Java
solr配置 中文分析器 IK Analyzer下载
solr配置 中文分析器 IK Analyzer下载
165 0
|
JSON 自然语言处理 Ubuntu
elasticsearch安装和使用ik分词器
本文一起来安装ik分词器,达到中文分词的效果
526 0
elasticsearch安装和使用ik分词器
|
自然语言处理 Java
|
应用服务中间件 自然语言处理
|
自然语言处理 应用服务中间件