【ES系列三】——ES集成ik分词并测试

简介: 解压后的结构如下图(需要放到elasticsearch安装目录的plugins文件夹下进行解压)

一、下载ik安装包


  https://github.com/medcl/elasticsearch-analysis-ik/releases

   注:一定要与ES版本保持一致(我ES用的是6.0.0所以ik也要下载6.0.0),如下图:


20171124123940258.png


二、解压


   1、可以通过命令:unzip 文件夹   进行解压

   2、要是没有unzip命令可以通过命令:yum install unzip  进行安装

   3、解压后的结构如下图(需要放到elasticsearch安装目录的plugins文件夹下进行解压):


20171124123955844.png


三、启动时进行加载


   1、通过下面命令(ps -ef | grep elastic)查看是否启动了ES,如果启动了,则通过kill命令(kill -9 进程号)杀死


20171124124008671.png


   2、启动之后如果有下面内容,证明ik插件加载成功(我是通过控制台启动的,后台启动命令在后面加 -d 即可)


20171124124022117.png


四、1、测试ik插件(通过head插件测试)


 注:ES版本5.0.0之后的测试方式

   1、新建一个索引


20171124124038102.png


   2、配饰内容进行测试如下图:


20171124124052163.png


四、2、测试ik插件(通过dos窗口测试)


   1、新建一个索引

     curl -XPUT http://localhost:9200/index2


20171124124106710.png


   2、直接输入下面内容进行测试(注:索引是刚才建立的索引)

     curl 'http://localhost:9200/index2/_analyze?analyzer=ik_max_word&pretty=true' -d '{"text":"我是中国人"}'


20171124124118636.png


五、ES2.0版本与ES5.0以后的版本对比以及注意事项


   1、5.0以后移除名为 ik 的analyzer和tokenizer,请分别使用 ik_smart 和 ik_max_word(也就是5.0之前进行测试的时候需要将上面中的ik_max_word换成ik关键字)

   2、ES6.0与ik6.0进行集成安装之后,只能通过head工具来进行测试,通过url进行测试的时候会报错,这是一个bug已经提交到gethub上了,希望社区管理能及时更正(亲测5.5.1版本没问题)。

   3、ES5.0之后的ik_smart和ik_max_word说明

     ik_max_word: 会将文本做最细粒度的拆分,比如会将“我是中国人”拆分为“我,是,中国人,中国,国人”,会穷尽各种可能的组合。

     ik_smart: 会做最粗粒度的拆分,比如会将“我是中国人”拆分为“我,是,中国人”。


六、总结


   这次的旅行虽然道路艰难,但是充满那么多的乐趣,的确是当真正搞懂它的时候,其实也就那么几步关键的地方,亲爱的读者们,期待小编后面的项目运用吧。

相关文章
|
1月前
|
数据管理 测试技术 持续交付
深入理解软件测试中的持续集成与持续部署
在现代软件开发实践中,持续集成(Continuous Integration, CI)和持续部署(Continuous Deployment, CD)是提升开发效率、保障产品质量的关键环节。本文将深入探讨CI/CD的概念、实施策略及其在软件测试中的作用,旨在为读者揭示如何通过有效的自动化流程来优化测试活动,减少人为错误,并实现快速反馈和迭代。文章还将讨论面临的挑战和可能的解决方案,以期帮助团队构建更加健壮的开发和测试环境。
|
1月前
|
敏捷开发 运维 测试技术
探索自动化测试在持续集成环境中的关键作用
【2月更文挑战第18天】 随着敏捷开发和DevOps文化的普及,持续集成(CI)已成为软件开发过程中不可或缺的组成部分。本文将深入探讨自动化测试在持续集成环境中的重要性,分析其如何提高软件交付速度、保障质量并减少人工干预。通过对现代软件工程实践中自动化测试策略的剖析,揭示了其在维护高效率和高质量软件产品中的核心地位。
33 7
|
1月前
|
敏捷开发 监控 jenkins
探索自动化测试在持续集成环境中的关键作用
【2月更文挑战第14天】 随着敏捷开发和持续集成(CI)的普及,自动化测试已成为确保软件质量和加速交付过程的重要环节。本文旨在深入探讨自动化测试在持续集成环境中的核心价值,分析其如何提高测试效率,减少人工错误,并保障产品的快速迭代与发布。通过对自动化测试工具、策略及最佳实践的综合评述,为读者呈现一个全面的自动化测试实施指南。
20 0
|
1月前
|
敏捷开发 监控 Devops
探索自动化测试在持续集成环境中的关键作用
【2月更文挑战第15天】 本文旨在探讨自动化测试作为软件开发过程中不可或缺的一环,尤其在持续集成(CI)环境中的显著影响。通过深入分析自动化测试的实施策略和最佳实践,文章揭示了如何有效提升软件交付速度和质量。文中不仅讨论了自动化测试的基本概念和框架选择,还详细阐述了其在CI流程中的关键步骤及潜在挑战,并提出了相应的解决方案。
21 4
|
1月前
|
敏捷开发 测试技术 持续交付
探索自动化测试在持续集成环境中的关键作用
【2月更文挑战第15天】 随着敏捷开发和持续集成(CI)实践的普及,自动化测试已成为确保软件质量和加速产品上市速度的核心环节。本文将深入探讨自动化测试在持续集成环境中的重要性,分析其如何提高测试效率,减少人工干预的错误,并实现快速反馈循环。通过案例分析和最佳实践分享,我们将揭示自动化测试策略对提升软件开发流程的影响,以及如何有效地将其整合到现代软件生命周期管理中。
|
1天前
|
数据挖掘 jenkins 测试技术
python集成测试持续集成
【4月更文挑战第20天】
8 2
|
1天前
|
测试技术 Python
python集成测试执行测试
【4月更文挑战第20天】
12 6
|
3天前
|
敏捷开发 测试技术 持续交付
探索自动化测试在持续集成中的关键作用
【4月更文挑战第24天】 随着敏捷开发和持续集成(CI)实践的普及,自动化测试已经成为确保软件质量和加速交付过程的核心环节。本文将深入探讨自动化测试如何与持续集成协同工作,提升开发流程的效率和可靠性。我们将分析自动化测试的策略、工具选择以及最佳实践,并讨论其对缩短反馈周期、降低风险和提高生产力的影响。通过案例研究和实际经验分享,本文旨在为读者提供实施高效自动化测试策略的深刻见解。
|
Java 测试技术
Java 中的单元测试和集成测试策略
【4月更文挑战第19天】本文探讨了Java开发中的单元测试和集成测试。单元测试专注于单一类或方法的功能验证,使用测试框架如JUnit,强调独立性、高覆盖率和及时更新测试用例。集成测试则验证模块间交互,通过逐步集成或模拟对象来检测系统整体功能。两者相辅相成,确保软件质量和降低修复成本。
|
9天前
|
监控 测试技术 数据安全/隐私保护
如何将代理IP集成到自动化测试框架中?
如何将代理IP集成到自动化测试框架中?

热门文章

最新文章