什么是 lucene|学习笔记

简介: 快速学习 什么是 lucene

开发者学堂课程【Lucene 知识精讲与实战(上) 什么是 lucene】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/700/detail/12326


什么是 lucene


内容介绍

一、全文检索的概念

二、什么是 Lucene

三、Lucene 的全文检索算法

四、Lucene 官网内容


一、全文检索的概念

全文检索:计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。


二、什么是 Lucene

Lucene 的项目发起人是 Doug Cutting,他不仅是 Lucene 的项目发起人,他还是Nutch、Hadoop 项目的发起人,Nutch 是一个非常好的分布式查重方向,hadoop 是一个离线大数据处理的技术。


三、Lucene 的全文检索算法

Lucene 底层封装的全文检索算法,也就是说它的查询速度非常快,Lucene 可以查询HTML、PDF 文档、文本文档,数据库中的数据、互联网中的数据,而我们会把这些数据进行搜集,然后把他们都放在 Lucene 的索引库当中,然后查的时候就从这个索引库中去查。


四、Lucene 官网内容

Lucene 的官网是:http://lucene.apache.org/

image.png

进去可以看到 Lucene 最新的版本是8.3.0,但是我们现在用的版本是7.7.2,选择这个版本的原因是在企业当中,企业并非追求的是最新的,而是长期追求的一个稳定版。

 

相关文章
|
5月前
|
索引
lucene入门使用
lucene入门使用
33 2
|
关系型数据库 MySQL 数据库
为什么要使用 Lucene|学习笔记
快速学习为什么要使用 Lucene
151 0
为什么要使用 Lucene|学习笔记
|
存储 自然语言处理 算法
Lucene学习总结
Lucene学习总结
104 0
Lucene学习总结
|
SQL 数据采集 自然语言处理
Lucene就是这么简单(一)
Lucene是apache软件基金会发布的一个开放源代码的全文检索引擎工具包,由资深全文检索专家Doug Cutting所撰写,它是一个全文检索引擎的架构,提供了完整的创建索引和查询索引,以及部分文本分析的引擎,Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎,Lucene在全文检索领域是一个经典的祖先,现在很多检索引擎都是在其基础上创建的,思想是相通的。
163 0
Lucene就是这么简单(一)
|
存储 Apache 索引
Lucene就是这么简单(二)
Lucene是apache软件基金会发布的一个开放源代码的全文检索引擎工具包,由资深全文检索专家Doug Cutting所撰写,它是一个全文检索引擎的架构,提供了完整的创建索引和查询索引,以及部分文本分析的引擎,Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎,Lucene在全文检索领域是一个经典的祖先,现在很多检索引擎都是在其基础上创建的,思想是相通的。
127 0
Lucene就是这么简单(二)
|
索引
lucene学习笔记
lucene学习笔记
138 0
|
开发框架 Java Apache
Lucene|学习笔记
快速学习 Lucene
119 0
|
Java 索引 自然语言处理
|
分布式计算 自然语言处理 Hadoop