ES上传自编译IK分词插件

简介: ES上传自编译IK分词插件

环境准备

案例背景: 阿里云ES不支持上传系统已有的插件, 例如IK分词器, 本篇文档介绍自定义上传IK分词插件使用, 以7.10版本的ES和IK插件为例, 通过自编译打包后自定义上传部署使用

使用场景: 由于本地使用的开源IK分词插件, 线上也希望使用开源的IK分词插件场景。例如 7.10.0版本的集群要使用7.10.0版本的开源Ik分词插件 (非阿里云默认提供)

1.插件下载

下载提供的插件zip包和源码下载地址  其他版本

2.创建阿里云集群(本文示例为7.10.0版本的ES集群)

3.准备本地开发工具IDEA和JDK环境


配置步骤

1.准备插件

下载插件到本地后查看下文件内容 (左侧是插件包,右侧是源码包(已重命名))

2.解压文件

解压源码包,使用IDEA打开这个项目

3.开发步骤

打开项目发现官方提供的7.4.0版本IK插件的源码使用的是7.4版本的依赖,这里改为7.10.0

修改分词方式,和默认的IK分词方式(ik_max_wordik_smart )区分一下, 这里将分词方式分别改为   ikk_smart ikk_max_word, 分词名称改为 analysis-ikk

修改后重新打包,双击package, 会生成一个jar文件

将上面生成的elasticsearch-analysis-ik-7.10.0.jar文件替换掉 插件解压后的 elasticsearch-analysis-ik-7.10.0.jar

注意:如果其他依赖需要替换的话也是同样的操作

还需要修改配置文件 plugin-descriptor.properties 中的插件名称

3.重新打包

上述都修改完成后, 重新打包如下,注意打包方式是全选插件文件

打包后出现一个zip包,重命名为 elasticsearch-analysis-ikk-7.10.0.zip

4.上传安装

登录阿里云ES控制台,在对应集群的自定义插件位置上传安装,然后等待集群变更完成

5.结果验证

相关文章
|
存储 自然语言处理 索引
ES分词器使用说明(analyzer)
本文章主要介绍了分词器的配置方法,以及分词器的优先级,同时配置了多个维度的分词器,哪一个分词器会生效,当出现分词结果不符合预期的时候,可以通过这个本文档内容进行梳理和排查。
2416 0
|
4月前
|
自然语言处理 应用服务中间件 nginx
一文教会你 分词器elasticsearch-analysis-ik 的安装使用【自定义分词库】
这篇文章是关于如何在Elasticsearch中安装和使用ik分词器的详细教程,包括版本匹配、安装步骤、分词测试、自定义词库配置以及创建使用ik分词器的索引的方法。
一文教会你 分词器elasticsearch-analysis-ik 的安装使用【自定义分词库】
|
7月前
|
自然语言处理 算法 搜索推荐
ES-IK分词器的概念和基本使用
ES-IK分词器的概念和基本使用
|
自然语言处理 Shell 索引
【ES系列七】——ik自定义分词词库
在利用ik分词的过程中,当ik的分词规则不满足我们的需求了,这个时候就可以利用ik的自定义词库进行筛选,举个例子:当我要将“我是中国人,我想测试一下”这句话通过分词,将“我想测试一下”分为一个词的时候,就需要利用ik的自定义词库进行灌入指定的词。
【ES系列七】——ik自定义分词词库
|
自然语言处理 索引
【ES系列三】——ES集成ik分词并测试
解压后的结构如下图(需要放到elasticsearch安装目录的plugins文件夹下进行解压)
|
缓存 自然语言处理
elasticsearch hanlp插件自定义词典配置
简要讲述elasticsearch hanlp 插件自定义词典配置
elasticsearch hanlp插件自定义词典配置
|
自然语言处理 索引
白话Elasticsearch29-IK中文分词之IK分词器配置文件+自定义词库
白话Elasticsearch29-IK中文分词之IK分词器配置文件+自定义词库
420 0
|
自然语言处理 安全 关系型数据库
白话Elasticsearch30-IK中文分词之热更新IK词库
白话Elasticsearch30-IK中文分词之热更新IK词库
238 0
|
监控 Shell 索引
如何安装ES的IK分词器插件?
如何安装ES的IK分词器插件?
324 0
|
自然语言处理 数据可视化 安全
ElasticSearch7入门(四)常用插件:Head插件与ik分词器
ElasticSearch7入门(四)常用插件:Head插件与ik分词器
447 0
ElasticSearch7入门(四)常用插件:Head插件与ik分词器