什么是 lucene|学习笔记

简介: 快速学习 什么是 lucene

开发者学堂课程【Lucene 知识精讲与实战(上) 什么是 lucene】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/700/detail/12326


什么是 lucene


内容介绍

一、全文检索的概念

二、什么是 Lucene

三、Lucene 的全文检索算法

四、Lucene 官网内容


一、全文检索的概念

全文检索:计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。


二、什么是 Lucene

Lucene 的项目发起人是 Doug Cutting,他不仅是 Lucene 的项目发起人,他还是Nutch、Hadoop 项目的发起人,Nutch 是一个非常好的分布式查重方向,hadoop 是一个离线大数据处理的技术。


三、Lucene 的全文检索算法

Lucene 底层封装的全文检索算法,也就是说它的查询速度非常快,Lucene 可以查询HTML、PDF 文档、文本文档,数据库中的数据、互联网中的数据,而我们会把这些数据进行搜集,然后把他们都放在 Lucene 的索引库当中,然后查的时候就从这个索引库中去查。


四、Lucene 官网内容

Lucene 的官网是:http://lucene.apache.org/

image.png

进去可以看到 Lucene 最新的版本是8.3.0,但是我们现在用的版本是7.7.2,选择这个版本的原因是在企业当中,企业并非追求的是最新的,而是长期追求的一个稳定版。

 

相关文章
|
5月前
|
索引
lucene入门使用
lucene入门使用
30 2
|
关系型数据库 MySQL 数据库
为什么要使用 Lucene|学习笔记
快速学习为什么要使用 Lucene
147 0
为什么要使用 Lucene|学习笔记
|
存储 自然语言处理 算法
Lucene学习总结
Lucene学习总结
104 0
Lucene学习总结
|
索引
lucene学习笔记
lucene学习笔记
137 0
|
开发框架 Java Apache
Lucene|学习笔记
快速学习 Lucene
118 0
|
Java 索引 自然语言处理
|
分布式计算 自然语言处理 Hadoop
|
Java Apache 索引