开发者学堂课程【Lucene 知识精讲与实战(上): 什么是 lucene】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/700/detail/12326
什么是 lucene
内容介绍
一、全文检索的概念
二、什么是 Lucene
三、Lucene 的全文检索算法
四、Lucene 官网内容
一、全文检索的概念
全文检索:计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
二、什么是 Lucene
Lucene 的项目发起人是 Doug Cutting,他不仅是 Lucene 的项目发起人,他还是Nutch、Hadoop 项目的发起人,Nutch 是一个非常好的分布式查重方向,hadoop 是一个离线大数据处理的技术。
三、Lucene 的全文检索算法
Lucene 底层封装的全文检索算法,也就是说它的查询速度非常快,Lucene 可以查询HTML、PDF 文档、文本文档,数据库中的数据、互联网中的数据,而我们会把这些数据进行搜集,然后把他们都放在 Lucene 的索引库当中,然后查的时候就从这个索引库中去查。
四、Lucene 官网内容
Lucene 的官网是:http://lucene.apache.org/
进去可以看到 Lucene 最新的版本是8.3.0,但是我们现在用的版本是7.7.2,选择这个版本的原因是在企业当中,企业并非追求的是最新的,而是长期追求的一个稳定版。