ElasticSearch7入门(四)常用插件:Head插件与ik分词器

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: ElasticSearch7入门(四)常用插件:Head插件与ik分词器

背景


简单介绍两个常用插件:


  1. ES可视化的Web插件:elasticsearch-head


  1. 中文分词友好的分词器:elasticsearch-analysis-ik

先跑起来再说。


elasticsearch-head


  1. Github上搜索下载安装elasticsearch-head,并解压;


  1. 安装依赖:npm install


  1. 启动:npm run start,访问http://localhost:9100。


  • Problem:


若未配置ElasticSearch的跨域,此时访问http://localhost:9100报错:


已拦截跨源请求:同源策略禁止读取位于 http://localhost:9200/_all远程资源。(原因:CORS 头缺少 'Access-Control-Allow-Origin')。

  • Solution:


开启ES跨域:编辑配置文件config/elasticsearch.yml,在最后添加

http.cors.enabled: true
http.cors.allow-origin: "*"


重新启动ES,再次访问http://localhost:9100,点击连接,结果如下图所示,可以看到当前有两个索引。


image.png

elasticsearch-head,作为ES的数据可视化客户端,主要的几个菜单包括:概览、索引、数据浏览、基本查询、符合查询等。在上一篇文章中,我们用到了数据浏览下的索引查看功能。


elasticsearch-analysis-ik


  • ES自带的分词器


ES内置的分词器有:standard, simple, whitespace, stop, language等,这种外国人搞的,对英文的支持自不必说,看个例子吧:

image.png

但是,当遇到中文时,懵逼了。。

image.png

  • 第三方:ik分词器


  1. 下载


Github上搜索中文分词器:elasticsearch-analysis-ik,这里用的版本与ES版本一致:7.5.2。


github.com/medcl/elast…


  1. 安装


解压至elasticsearch-7.5.2\plugins\ik目录,ik这个目录可以自定义名称,不用配置其他的文件,重启ES。


记得重启ES,如果没有重启,则会报错:

image.png

下图为重启后,控制台的输出,可以看到加载了ik分词器:


image.png

  1. 测试
  • 中文

image.png

  • 中英文

image.png

image.png

image.png

  1. 分词模式


ik 提供了两种分词模式:ik_smart, ik_max_word,前面例子用的都是ik_smart


  • ik_smart:最小切分

image.png

  • ik_max_word:最细切分

image.png

image.png

显然,可看到两种方式的区别。


  1. 自定义分词


以“新冠病毒肺炎”为例,我想让分词器将新冠作为一个词,由于ik分词器本身的词库中未录入这个词,我们在前面也看到了,ik分词器会将新冠作为两个字来处理;那么,这里手动录入这个词条。


添加词条(elasticsearch-7.5.2\plugins\ik\config):这里直接写在了main.dic中。

image.png

看下加入自定义词条后的分词效果:

image.png

image.png

新冠成功分为一个词,而不是前面两个字。



相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
1月前
|
数据可视化 索引
elasticsearch head、kibana 安装和使用
elasticsearch head、kibana 安装和使用
|
4月前
|
安全 Linux 开发工具
Elasticsearch 搜索入门技术之一
Elasticsearch 搜索入门技术之一
228 1
|
5月前
ElasticSearch-Head浏览器插件离线安装
ElasticSearch-Head浏览器插件离线安装
100 0
|
7月前
|
人工智能 数据可视化 Java
ElasticSearch安装、插件介绍及Kibana的安装与使用详解
ElasticSearch安装、插件介绍及Kibana的安装与使用详解
ElasticSearch安装、插件介绍及Kibana的安装与使用详解
|
5月前
|
JSON 自然语言处理 数据库
数据库-ElasticSearch入门(索引、文档、查询)
数据库-ElasticSearch入门(索引、文档、查询)
315 0
|
5月前
|
安全 大数据 Java
elasticsearch|大数据|低版本的elasticsearch集群的官方安全插件x-pack的详解
elasticsearch|大数据|低版本的elasticsearch集群的官方安全插件x-pack的详解
55 0
|
7月前
|
存储 关系型数据库 数据库
ElasticSearch深度解析入门篇:高效搜索解决方案的介绍与实战案例讲解,带你避坑
ElasticSearch深度解析入门篇:高效搜索解决方案的介绍与实战案例讲解,带你避坑
ElasticSearch深度解析入门篇:高效搜索解决方案的介绍与实战案例讲解,带你避坑
|
6天前
|
自然语言处理 算法 索引
Elasticsearch 8.X 分词插件版本更新不及时解决方案
Elasticsearch 8.X 分词插件版本更新不及时解决方案
10 0
|
22天前
|
自然语言处理 Java Shell
Elasticsearch【环境搭建 01】【elasticsearch-6.4.3 单机版】(含 安装包+分词插件 云盘资源)
【4月更文挑战第12天】Elasticsearch【环境搭建 01】【elasticsearch-6.4.3 单机版】(含 安装包+分词插件 云盘资源)
25 2
|
3月前
|
存储 关系型数据库 MySQL
ElasticSearch 入门
【2月更文挑战第7天】ElasticSearch 入门 简介 ElasticSearch 的基本概念 ElasticSearch 的查询流程 ElasticSearch 的更新流程
40 2