(solr系列:三)如何在solr中添加ik分词器

简介:

 分词技术是搜索技术里面的一块基石。很多人用过,如果你只是为了简单快速地搭一个搜索引擎,你确实不用了解太深。但一旦涉及效果问题,分词器上就可以做很多文章。例如, 在我们实际用作电商领域的搜索的工作中,类目预判的实现就极须依赖分词,至少需要做到可以对分词器动态加规则。再一个简单的例子,如果你的优化方法就是对不同的词分权重,提高一些重点词的权重的话,你就需要依赖并理解分词器。

   下面将介绍如何在solr中为core:simple的title添加分词,承接上一篇博文(http://simplelife.blog.51cto.com/9954761/1864073 ),

启动tomcat,浏览器中访问:localhost:8080/solr


wKiom1gI6p-yVuwLAAJJPyzCs84257.png如图,点击collection1中的Analysis,在Field Value (Index)中输入:我爱北京天安门,并选择Analyse Fieldname / FieldType为:title

wKiom1gI647ggzs8AALNLsEwfMA590.png

我们知道,我是没有对默认的core:collection1的title做分词的,所以当我输入一句话时并不会被分词。

下面我就为自定义这个core:simple的标题做分词,看看做完分词之后搜索的效果是什么……敬请期待!

========================================================================================

1、下载ik分词器的jar包:http://pan.baidu.com/s/1eScBIJC 

2、将下载下来的jar包复制到apache-tomcat-7.0.72\webapps\solr\WEB-INF\lib中

3、在solrhome\simple\conf下的schema.xml文件中添加fieldType:

1
2
3
< fieldType  name = "text_ik"  class = "solr.TextField" >   
      < analyzer  class = "org.wltea.analyzer.lucene.IKAnalyzer" />   
</ fieldType >

然后将field中name="title"的type修改成text_ik,如下图:

wKioL1gI7WjyEalWAABmBSvrte8945.png

4、重启tomcat,浏览器中访问:localhost:8080/solr, 选择simple-->Analysis,重新上面的操作看效果:

wKiom1gI7majO-NMAAJJg6Hlzvg305.png

如果做到这,那么恭喜你,完成了solr中ik分词器的使用。


本文转自 兴趣e族 51CTO博客,原文链接:http://blog.51cto.com/simplelife/1864080


相关文章
|
8月前
|
Java Maven 开发工具
【ElasticSearch 】IK 分词器安装
【ElasticSearch 】IK 分词器安装
467 1
|
2月前
|
测试技术 API 开发工具
ElasticSearch的IK分词器
ElasticSearch的IK分词器
62 7
|
自然语言处理 算法 Docker
ElasticSearch学习笔记(四) IK分词
前面了解了Elasticsearch中对索引及文档的基本操作。今天了解Es中非常重要的一个概念:分词。在 Elasticsearch 中,中文分词的首选分词器是 ik 分词器。在本文中,我们将介绍如何使用 ik 分词器将商品名称(name)字段进行分词,并详细介绍分词过程及结果等。
589 2
|
自然语言处理 关系型数据库 MySQL
Elasticsearch之IK分词器配置
Elasticsearch之IK分词器配置
436 0
|
JSON 自然语言处理 数据格式
ElasticSearch用ik_analyzer分词器出现报错
ElasticSearch用ik_analyzer分词器出现报错
276 0
|
JSON 自然语言处理 Ubuntu
elasticsearch安装和使用ik分词器
本文一起来安装ik分词器,达到中文分词的效果
629 0
elasticsearch安装和使用ik分词器
|
自然语言处理 API 开发工具
elasticsearch7.13.4 ik中文分词器安装
elasticsearch7.13.4 ik中文分词器安装
355 0
|
自然语言处理 Java 测试技术
|
自然语言处理 索引 测试技术
Elasticsearch 5 Ik+pinyin分词配置详解
一、拼音分词的应用 拼音分词在日常生活中其实很常见,也许你每天都在用。打开淘宝看一看吧,输入拼音”zhonghua”,下面会有包含”zhonghua”对应的中文”中华”的商品的提示: 拼音分词是根据输入的拼音提示对应的中文,通过拼音分词提升搜索体验、加快搜索速度。
1539 0
|
自然语言处理 Java