【ELK】(三)Elasticsearch 安装IK中文分词器

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 【ELK】(三)Elasticsearch 安装IK中文分词器

文章目录


前言

1. 下载IK安装包

2. 上传安装包并进行解压

3. IK中文分词测试


前言


没有中文分词器,我们在使用es的时候会有很多不方便的地方,es中对于字符串的默认内置分词是standard类型的,但是这对于中文来说就无能为力了,下面简单介绍一下es中怎么安装IK分词器插件。


1. 下载IK安装包


下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases


选择Elasticsearch对应的IK版本:


image.png


2. 上传安装包并进行解压


1、这里安装包我们上传到Elasticsearch 文件夹下的plugins目录下

[root@tokgo elasticsearch622]# cd plugins/
[root@tokgo plugins]# ls
elasticsearch-analysis-ik-6.2.2.zip
[root@tokgo plugins]# unzip elasticsearch-analysis-ik-6.2.2.zip


2、在解压完成后必须删除下载后的压缩包,否则重启es服务时会报错,无法正常加载并将解压后的文件夹重命名为ikchina

[root@tokgo plugins]# rm -rf elasticsearch-analysis-ik-6.2.2.zip 
[root@tokgo plugins]# mv elasticsearch/ ikchina
[root@tokgo plugins]# ls
ikchina


3、重新启动es,启动成功后,下面我们来做个简单的实验验证一下

$ ps -aux|grep elasticsearch
$ kill -9 3749
$ ./elasticsearch


3. IK中文分词测试


假如我们直接使用standard进行分词,我们使用它对中文进行分词看看有什么效果,执行如下语句


image.png


得到的结果如下:我们发现被分成了一个个单一的词,很明显这并不是我们想要的效果,因为单个词汇在文档搜索中意义并不大


image.png


安装了中文分词器后,我们再来做如下设置

PUT /my_index 
{
  "mappings": {
    "my_type": {
      "properties": {
        "text": {
          "type": "text",
          "analyzer": "ik_max_word"
        }
      }
    }
  }
}

image.pngimage.png


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
5月前
|
Java Maven 开发工具
【ElasticSearch 】IK 分词器安装
【ElasticSearch 】IK 分词器安装
255 1
|
2月前
|
运维 监控 Ubuntu
一键启动日志魔法:揭秘ELK自动安装脚本的神秘面纱!
【8月更文挑战第9天】在数据驱动时代,高效处理日志至关重要。ELK Stack(Elasticsearch、Logstash、Kibana)是强大的日志分析工具,但其复杂的安装配置常让初学者望而却步。本文介绍如何编写ELK自动安装脚本,简化部署流程。脚本适用于Ubuntu系统,自动完成ELK下载、安装及基本配置,包括依赖项安装、服务启动及自启设置,极大降低了使用门槛,助力运维人员和开发者轻松构建日志分析平台。
106 6
|
2月前
|
Linux Docker 容器
Docker 安装 ELK,EFK代替
Docker 安装 ELK,EFK代替
24 0
|
2月前
|
Docker 容器
Docker 安装 ELK
Docker 安装 ELK
19 0
|
3月前
|
存储 缓存 数据处理
ELK中 Elasticsearch和Logstash内存大小设置的考虑
ELK中 Elasticsearch和Logstash内存大小设置的考虑
146 0
|
4月前
|
自然语言处理 搜索推荐
在Elasticsearch 7.9.2中安装IK分词器并进行自定义词典配置
在Elasticsearch 7.9.2中安装IK分词器并进行自定义词典配置
223 1
|
4月前
|
自然语言处理 数据可视化 Linux
ElasticSearch安装ik分词器_使用_自定义词典
ElasticSearch安装ik分词器_使用_自定义词典
44 1
|
5月前
|
监控 应用服务中间件 nginx
使用 Docker Compose V2 快速搭建日志分析平台 ELK (Elasticsearch、Logstash 和 Kibana)
ELK的架构有多种,本篇分享使用的架构如图所示: Beats(Filebeat) -> -> Elasticsearch -> Kibana,目前生产环境一天几千万的日志,内存占用大概 10G
279 4
|
5月前
|
自然语言处理 Java Maven
【ElasticSearch】分词器(ElasticSearchIK分词器)
【ElasticSearch】分词器(ElasticSearchIK分词器)
62 1
|
10天前
|
存储 消息中间件 网络协议
日志平台-ELK实操系列(一)
日志平台-ELK实操系列(一)
下一篇
无影云桌面