下载hanlp插件
这里大家根据自己对应的elasticsearch版本下载匹配版本的hanlp插件,由于hanlp及elasticsearch各个版本之间差别较大,如果版本不匹配可能导致hanlp插件安装失败或者安装之后不可用,这里我们用的elasticsearch版本是6.7.1,因此我下载的hanlp插件版本也是6.7.1,已经放在了百度网盘,插件地址:
链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq
提取码:fteq 有需要的可以去下载。另外需要其他版本hanlp插件的可以去github上面下载,下载地址:https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的hanlp插件
上传hanlp插件到elasticsearch服务器
这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个ES_HOME的概念,这里需要提前说明一下,对于我的服务器来说,ES_HOME路径就是 /elk6.7.1/elasticsearch-6.7.1
安装hanlp插件
切换到es对应的插件文件夹plugins下,创建hanlp文件夹analysis-hanlp
# cd ES_HOME/plugins/# mkdir analysis-hanlp
切换到analysis-hanlp文件夹下,上传文件elasticsearch-analysis-hanlp-6.7.1.zip或者将上面已经上传好的文件通过命令cp 、 mv 拷贝至analysis-hanlp文件夹下
# cd analysis-hanlp# rz 本地文件地址
解压hanlp插件文件elasticsearch-analysis-hanlp-6.7.1.zip
# unzip elasticsearch-analysis-hanlp-6.7.1.zip
解压完成之后回到ES_HOME下的config文件夹下创建analysis-hanlp文件夹
# cd ES_HOME/config/# mkdir analysis-hanlp
切换到hanlp插件解压后文件的config文件夹中,拷贝config文件夹下的文件到ES_HOME下的config文件夹下的analysis-hanlp
# cd ES_HOME/plugins/analysis-hanlp/config# mv ./* ES_HOME/config/analysis-hanlp/
再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es
# cd ES_HOME# chown -R es.es plugins/# chown -R es.es config/# 重新启动es
至此elasticsearch hanlp插件的安装就算完成了,在kibana上面测试
kibana测试
测试代码如下
POST _analyze { "text": "自建底商转为办公自用 为什么不属于销售或者视同销售?", "analyzer": "hanlp"}
测试效果
{ "tokens" : [ { "token" : "自建", "start_offset" : 0, "end_offset" : 2, "type" : "l", "position" : 0 }, { "token" : "底商", "start_offset" : 2, "end_offset" : 4, "type" : "nz", "position" : 1 }, { "token" : "转为", "start_offset" : 4, "end_offset" : 6, "type" : "v", "position" : 2 }, { "token" : "办公", "start_offset" : 6, "end_offset" : 8, "type" : "vn", "position" : 3 }, { "token" : "自用", "start_offset" : 8, "end_offset" : 10, "type" : "vn", "position" : 4 }, { "token" : "为什么", "start_offset" : 11, "end_offset" : 14, "type" : "ryv", "position" : 5 }, { "token" : "不", "start_offset" : 14, "end_offset" : 15, "type" : "d", "position" : 6 }, { "token" : "属于", "start_offset" : 15, "end_offset" : 17, "type" : "v", "position" : 7 }, { "token" : "销售", "start_offset" : 17, "end_offset" : 19, "type" : "vn", "position" : 8 }, { "token" : "或者", "start_offset" : 19, "end_offset" : 21, "type" : "c", "position" : 9 }, { "token" : "视同", "start_offset" : 21, "end_offset" : 23, "type" : "n", "position" : 10 }, { "token" : "销售", "start_offset" : 23, "end_offset" : 25, "type" : "vn", "position" : 11 }, { "token" : "?", "start_offset" : 25, "end_offset" : 26, "type" : "w", "position" : 12 } ] }
测试结果效果图如下
到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。