ElasticSearch7入门(四)常用插件:Head插件与ik分词器

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: ElasticSearch7入门(四)常用插件:Head插件与ik分词器

背景


简单介绍两个常用插件:


  1. ES可视化的Web插件:elasticsearch-head


  1. 中文分词友好的分词器:elasticsearch-analysis-ik

先跑起来再说。


elasticsearch-head


  1. Github上搜索下载安装elasticsearch-head,并解压;


  1. 安装依赖:npm install


  1. 启动:npm run start,访问http://localhost:9100。


  • Problem:


若未配置ElasticSearch的跨域,此时访问http://localhost:9100报错:


已拦截跨源请求:同源策略禁止读取位于 http://localhost:9200/_all远程资源。(原因:CORS 头缺少 'Access-Control-Allow-Origin')。

  • Solution:


开启ES跨域:编辑配置文件config/elasticsearch.yml,在最后添加

http.cors.enabled: true
http.cors.allow-origin: "*"


重新启动ES,再次访问http://localhost:9100,点击连接,结果如下图所示,可以看到当前有两个索引。


image.png

elasticsearch-head,作为ES的数据可视化客户端,主要的几个菜单包括:概览、索引、数据浏览、基本查询、符合查询等。在上一篇文章中,我们用到了数据浏览下的索引查看功能。


elasticsearch-analysis-ik


  • ES自带的分词器


ES内置的分词器有:standard, simple, whitespace, stop, language等,这种外国人搞的,对英文的支持自不必说,看个例子吧:

image.png

但是,当遇到中文时,懵逼了。。

image.png

  • 第三方:ik分词器


  1. 下载


Github上搜索中文分词器:elasticsearch-analysis-ik,这里用的版本与ES版本一致:7.5.2。


github.com/medcl/elast…


  1. 安装


解压至elasticsearch-7.5.2\plugins\ik目录,ik这个目录可以自定义名称,不用配置其他的文件,重启ES。


记得重启ES,如果没有重启,则会报错:

image.png

下图为重启后,控制台的输出,可以看到加载了ik分词器:


image.png

  1. 测试
  • 中文

image.png

  • 中英文

image.png

image.png

image.png

  1. 分词模式


ik 提供了两种分词模式:ik_smart, ik_max_word,前面例子用的都是ik_smart


  • ik_smart:最小切分

image.png

  • ik_max_word:最细切分

image.png

image.png

显然,可看到两种方式的区别。


  1. 自定义分词


以“新冠病毒肺炎”为例,我想让分词器将新冠作为一个词,由于ik分词器本身的词库中未录入这个词,我们在前面也看到了,ik分词器会将新冠作为两个字来处理;那么,这里手动录入这个词条。


添加词条(elasticsearch-7.5.2\plugins\ik\config):这里直接写在了main.dic中。

image.png

看下加入自定义词条后的分词效果:

image.png

image.png

新冠成功分为一个词,而不是前面两个字。



相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
目录
相关文章
|
11月前
|
存储 Java API
Elasticsearch 7.8.0从入门到精通
这篇文章详细介绍了Elasticsearch 7.8.0的安装、核心概念(如正排索引和倒排索引)、RESTful风格、各种索引和文档操作、条件查询、聚合查询以及在Spring Boot中整合Elasticsearch的步骤和示例。
497 1
Elasticsearch 7.8.0从入门到精通
|
11月前
|
自然语言处理 大数据 应用服务中间件
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
205 5
|
11月前
|
自然语言处理 Java 网络架构
elasticsearch学习三:elasticsearch-ik分词器的自定义配置 分词内容
这篇文章是关于如何自定义Elasticsearch的ik分词器配置以满足特定的中文分词需求。
516 0
elasticsearch学习三:elasticsearch-ik分词器的自定义配置 分词内容
|
12月前
|
数据可视化 Java Windows
Elasticsearch入门-环境安装ES和Kibana以及ES-Head可视化插件和浏览器插件es-client
本文介绍了如何在Windows环境下安装Elasticsearch(ES)、Elasticsearch Head可视化插件和Kibana,以及如何配置ES的跨域问题,确保Kibana能够连接到ES集群,并提供了安装过程中可能遇到的问题及其解决方案。
Elasticsearch入门-环境安装ES和Kibana以及ES-Head可视化插件和浏览器插件es-client
|
10月前
|
存储 JSON Java
ELK 圣经:Elasticsearch、Logstash、Kibana 从入门到精通
ELK是一套强大的日志管理和分析工具,广泛应用于日志监控、故障排查、业务分析等场景。本文档将详细介绍ELK的各个组件及其配置方法,帮助读者从零开始掌握ELK的使用。
|
10月前
|
测试技术 API 开发工具
ElasticSearch的IK分词器
ElasticSearch的IK分词器
191 7
|
11月前
|
存储 JSON Java
elasticsearch学习一:了解 ES,版本之间的对应。安装elasticsearch,kibana,head插件、elasticsearch-ik分词器。
这篇文章是关于Elasticsearch的学习指南,包括了解Elasticsearch、版本对应、安装运行Elasticsearch和Kibana、安装head插件和elasticsearch-ik分词器的步骤。
972 0
elasticsearch学习一:了解 ES,版本之间的对应。安装elasticsearch,kibana,head插件、elasticsearch-ik分词器。
|
4月前
|
JSON 安全 数据可视化
Elasticsearch(es)在Windows系统上的安装与部署(含Kibana)
Kibana 是 Elastic Stack(原 ELK Stack)中的核心数据可视化工具,主要与 Elasticsearch 配合使用,提供强大的数据探索、分析和展示功能。elasticsearch安装在windows上一般是zip文件,解压到对应目录。文件,elasticsearch8.x以上版本是自动开启安全认证的。kibana安装在windows上一般是zip文件,解压到对应目录。elasticsearch的默认端口是9200,访问。默认用户是elastic,密码需要重置。
1595 0
|
5月前
|
安全 Java Linux
Linux安装Elasticsearch详细教程
Linux安装Elasticsearch详细教程
699 1
|
10月前
|
存储 安全 数据管理
如何在 Rocky Linux 8 上安装和配置 Elasticsearch
本文详细介绍了在 Rocky Linux 8 上安装和配置 Elasticsearch 的步骤,包括添加仓库、安装 Elasticsearch、配置文件修改、设置内存和文件描述符、启动和验证 Elasticsearch,以及常见问题的解决方法。通过这些步骤,你可以快速搭建起这个强大的分布式搜索和分析引擎。
370 5