elasticsearch hanlp 插件安装操作

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 简要简述elasticsearch hanlp插件的基本安装操作

下载hanlp插件

这里大家根据自己对应的elasticsearch版本下载匹配版本的hanlp插件,由于hanlp及elasticsearch各个版本之间差别较大,如果版本不匹配可能导致hanlp插件安装失败或者安装之后不可用,这里我们用的elasticsearch版本是6.7.1,因此我下载的hanlp插件版本也是6.7.1,已经放在了百度网盘,插件地址:

链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq

提取码:fteq  有需要的可以去下载。另外需要其他版本hanlp插件的可以去github上面下载,下载地址:https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的hanlp插件

image.png

上传hanlp插件到elasticsearch服务器

这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个ES_HOME的概念,这里需要提前说明一下,对于我的服务器来说,ES_HOME路径就是 /elk6.7.1/elasticsearch-6.7.1image.png


安装hanlp插件

切换到es对应的插件文件夹plugins下,创建hanlp文件夹analysis-hanlp

# cd ES_HOME/plugins/# mkdir analysis-hanlp

image.png

切换到analysis-hanlp文件夹下,上传文件elasticsearch-analysis-hanlp-6.7.1.zip或者将上面已经上传好的文件通过命令cp 、 mv 拷贝至analysis-hanlp文件夹下

# cd analysis-hanlp# rz 本地文件地址

image.png

解压hanlp插件文件elasticsearch-analysis-hanlp-6.7.1.zip

# unzip elasticsearch-analysis-hanlp-6.7.1.zip

解压完成之后回到ES_HOME下的config文件夹下创建analysis-hanlp文件夹

# cd ES_HOME/config/# mkdir analysis-hanlp

切换到hanlp插件解压后文件的config文件夹中,拷贝config文件夹下的文件到ES_HOME下的config文件夹下的analysis-hanlp

# cd ES_HOME/plugins/analysis-hanlp/config# mv ./* ES_HOME/config/analysis-hanlp/

image.png

再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es

# cd ES_HOME# chown -R es.es plugins/# chown -R es.es config/# 重新启动es

至此elasticsearch hanlp插件的安装就算完成了,在kibana上面测试

kibana测试

测试代码如下

POST _analyze
{
"text": "自建底商转为办公自用 为什么不属于销售或者视同销售?",
"analyzer": "hanlp"}

测试效果

{
"tokens" : [
    {
"token" : "自建",
"start_offset" : 0,
"end_offset" : 2,
"type" : "l",
"position" : 0    },
    {
"token" : "底商",
"start_offset" : 2,
"end_offset" : 4,
"type" : "nz",
"position" : 1    },
    {
"token" : "转为",
"start_offset" : 4,
"end_offset" : 6,
"type" : "v",
"position" : 2    },
    {
"token" : "办公",
"start_offset" : 6,
"end_offset" : 8,
"type" : "vn",
"position" : 3    },
    {
"token" : "自用",
"start_offset" : 8,
"end_offset" : 10,
"type" : "vn",
"position" : 4    },
    {
"token" : "为什么",
"start_offset" : 11,
"end_offset" : 14,
"type" : "ryv",
"position" : 5    },
    {
"token" : "不",
"start_offset" : 14,
"end_offset" : 15,
"type" : "d",
"position" : 6    },
    {
"token" : "属于",
"start_offset" : 15,
"end_offset" : 17,
"type" : "v",
"position" : 7    },
    {
"token" : "销售",
"start_offset" : 17,
"end_offset" : 19,
"type" : "vn",
"position" : 8    },
    {
"token" : "或者",
"start_offset" : 19,
"end_offset" : 21,
"type" : "c",
"position" : 9    },
    {
"token" : "视同",
"start_offset" : 21,
"end_offset" : 23,
"type" : "n",
"position" : 10    },
    {
"token" : "销售",
"start_offset" : 23,
"end_offset" : 25,
"type" : "vn",
"position" : 11    },
    {
"token" : "?",
"start_offset" : 25,
"end_offset" : 26,
"type" : "w",
"position" : 12    }
  ]
}

测试结果效果图如下

image.png

到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
ElasticSearch-Head浏览器插件离线安装
ElasticSearch-Head浏览器插件离线安装
158 0
|
2月前
|
JSON 自然语言处理 Java
Java原生操作Elasticsearch
Java原生操作Elasticsearch
63 0
|
9月前
|
人工智能 数据可视化 Java
ElasticSearch安装、插件介绍及Kibana的安装与使用详解
ElasticSearch安装、插件介绍及Kibana的安装与使用详解
ElasticSearch安装、插件介绍及Kibana的安装与使用详解
|
10月前
|
关系型数据库 MySQL 索引
ElasticSearch高级操作3
ElasticSearch高级操作3
112 0
|
10月前
|
自然语言处理 Java 索引
ElasticSearch高级操作2
ElasticSearch高级操作2
90 0
|
2月前
|
安全 大数据 Java
elasticsearch|大数据|低版本的elasticsearch集群的官方安全插件x-pack的详解
elasticsearch|大数据|低版本的elasticsearch集群的官方安全插件x-pack的详解
74 0
|
2月前
|
安全 大数据 API
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
127 0
|
20天前
|
JSON DataWorks 关系型数据库
DataWorks操作报错合集之同步Elasticsearch数据报错:Cat response did not contain a JSON Array,是什么导致的
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
2月前
|
Kubernetes 关系型数据库 MySQL
实时计算 Flink版产品使用合集之在Kubernetes(k8s)中同步MySQL变更到Elasticsearch该怎么操作
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
2月前
|
安全 Java API
SpringBoot 实现 elasticsearch 索引操作(RestHighLevelClient 的应用)
SpringBoot 实现 elasticsearch 索引操作(RestHighLevelClient 的应用)
30 1