方便Lucene高版本使用IKAnalyzer分词

简介: whyIKAnalyzer是个很不错的中文分词工具,但已经不维护了,但只支持低版本的Lucene,为了兼容Lucene6.x版本,这里是小改动了一些然后放到github上,方便有需要的人使用。

why

IKAnalyzer是个很不错的中文分词工具,但已经不维护了,但只支持低版本的Lucene,为了兼容Lucene6.x版本,这里是小改动了一些然后放到github上,方便有需要的人使用。

也对Lucene源码比较熟,后面有必要再自己重新写个分词工具。

changes

  • Lucene的Analyzer抽象类有变。
  • Lucene的Tokenizer抽象类有变。
  • Lucene的BooleanQuery有变。
  • Lucene的QueryParser有变。

https://github.com/sea-boat/IKAnalyzer-Mirror

how to use

<dependency>
  <groupId>com.seaboat</groupId>
  <artifactId>IKAnalyzer</artifactId>
  <version>7.4.0</version>
</dependency>

====广告时间,可直接跳过====

鄙人的新书《Tomcat内核设计剖析》已经在京东预售了,有需要的朋友可以到 https://item.jd.com/12185360.html 进行预定。感谢各位朋友。

=========================

欢迎关注:

这里写图片描述

目录
相关文章
|
存储 自然语言处理 应用服务中间件
20Solr配置中文分析器
20Solr配置中文分析器
45 0
|
自然语言处理 安全 关系型数据库
白话Elasticsearch30-IK中文分词之热更新IK词库
白话Elasticsearch30-IK中文分词之热更新IK词库
201 0
|
存储 XML SQL
solr之Ik中文分析器的安装
solr之Ik中文分析器的安装
128 0
|
自然语言处理 算法 架构师
Lucene优化(分词器的选择) | 学习笔记
快速学习Lucene优化(分词器的选择)。
Lucene优化(分词器的选择) | 学习笔记
|
自然语言处理
Elasticsearch自定义分析器analyzer分词实践
Elasticsearch自定义分析器analyzer分词实践
189 0
Elasticsearch自定义分析器analyzer分词实践
五分钟带你玩转Elasticsearch(七)看了这篇文档,教你无脑安装ik分词器
五分钟带你玩转Elasticsearch(七)看了这篇文档,教你无脑安装ik分词器
100 0
五分钟带你玩转Elasticsearch(七)看了这篇文档,教你无脑安装ik分词器
|
自然语言处理 Linux
elasticsearch扩展ik分词器词库
elasticsearch扩展ik分词器词库
337 0
|
自然语言处理
IKAnalyzer - 轻量级的中文分词工具
采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。
1205 0
|
自然语言处理 Java Maven
HanLP中文分词Lucene插件
基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。
2008 0
|
Java Apache 索引
Lucene实现全文检索技术(包含SpringBoot整合Lucene 7.6.0 )
Lucene实现全文检索的流程 ① 绿色表示索引过程,对要搜索的原始内容进行索引构建一个索引库,索引过程包括: 确定原始内容即要搜索的内容à采集文档à创建文档à分析文档à索引文档 ② 红色表示搜索过程,从索引库中搜索内容,搜索过程...
3837 0