一步一步学lucene——(第二步:示例篇)

简介:

在上面的篇幅中我们已经了解到了lucene,及lucene到底是做什么的,什么情况下才能够使用lucene,下面我们就结合一个例子来详细说明一下lucene的API,看看lucene是如何工作的。

lucene的下载

其实这个很简单了,直接到baidu或者google上搜索一下,一般情况下第一个就是我们要的链接。下边给出lucene下载的链接:

http://lucene.apache.org/

                图:lucene下载主页面

配置环境

我们下面要做很多的测试,会建立很多的测试工程,如果一个一个手动的添加jar包会非常的麻烦,那么我们就需要配置eclipse环境。

打开eclipse,选择windows->preferences->java->build path->user libraries

将我们上边下载后的lucene中的包全部加载到这个用户变量中。

               图:eclipse中加入的用户变量

建立索引

下面这个程序就是读取指定文件夹下的文件并且将文件生成索引的过程,它有两个参数,一个是要索引的文件路径,一个是索引存放的路径。

我们将文件放到我们硬盘的目录上,然后通过程序建立索引。

索引程序如下:

View Code

然后在工程上点击右键Run->Run configuration,新建一个Java Application,输入两个参数一个是索引目录,一个是文件存放目录

                    图:配置运行界面

运行后可以行到分析结果,当然目录中索引的内容不同得到的结果也就会不同。

        图:索引txt文件时输出

根据索引查询

因为这里边还没涉及到中文的部分,所以我们查询所有文档中包括"RUNNING"的文档。

程序内容如下:

View Code

同上操作,配置新的Java Application,如下图:

                  图:配置查询参数

点击运行,可以得到运行结果。

也就是我们上面索引的文件,当然,随着文件的多少及大小,速度会不同,这里只是一个演示程序,你可以根据你本身的程序自行设置查询条件。

索引过程中的几个核心类

IndexWriter

IndexWriter是索引过程的核心组件。用于创建一个新的索引并把文档加到已有的索引中去,也可以向索引中添加、删除和更新被索引文档的信息。

Directory

Directory类描述了Lucene索引的存放位置。

Analyzer

Analyzer是分词器接口,文本文件在被索引之前,需要经过Analyzer处理。常用的中文分词器有庖丁、IKAnalyzer等。

Document

Document对象代表一组域(Field)的集合。其实说白了就是文件,可能是文本文件,word或者pdf等。

Field

Field就是每个文档中包含的不同的域。

lucene构建索引的流程图如下:

                图:lucene构建索引流程

搜索过程中的几个核心类

IndexSearcher

IndexSearcher是对前边IndexWriter创建的索引进行搜索。

Term

Term对象是搜索功能的基本单元,跟Field对象非常类似,可以放入我们查询的条件。

Query

Query就是Lucene给我们的查询接口,它有很多的子类,我们可以基于这些进行功能丰富的查询。

TermQuery

TermQuery是Lucene提供的最基本的查询类型。

TopDocs

TopDocs类是一个简单的指针容器,指针一般指向前N个排名的搜索结果,搜索结果即匹配查询条件的文档。

                    图:lucene查询请求流程

[源码下载]

目录
相关文章
|
7月前
|
安全 Python
Elasticsearch 删除重复文档实现方式,你知道几个?
Elasticsearch 删除重复文档实现方式,你知道几个?
75 0
|
7月前
|
SQL 数据采集 Java
Java【代码分享 02】商品全部分类数据获取(建表语句+Jar包依赖+树结构封装+获取及解析源代码)包含csv和sql格式数据下载可用
Java【代码分享 02】商品全部分类数据获取(建表语句+Jar包依赖+树结构封装+获取及解析源代码)包含csv和sql格式数据下载可用
81 0
|
JSON Java API
Elasticsearch——使用Java API实现ES中的索引、映射、文档操作(上)
Elasticsearch——使用Java API实现ES中的索引、映射、文档操作 (上)
1460 0
Elasticsearch——使用Java API实现ES中的索引、映射、文档操作(上)
|
存储 前端开发 Java
ElasticSearch快速入门之创建索引库、创建映射、创建文档、搜索文档
ElasticSearch快速入门之创建索引库、创建映射、创建文档、搜索文档
399 0
|
Java API 索引
Elasticsearch——使用Java API实现ES中的索引、映射、文档操作(下)
Elasticsearch——使用Java API实现ES中的索引、映射、文档操作(下)
Elasticsearch——使用Java API实现ES中的索引、映射、文档操作(下)
|
Java API 数据安全/隐私保护
SpringBoot高级篇搜索Solr之文档新增与修改使用姿势
大多涉及到数据的处理,无非CURD四种操作,对于搜索SOLR而言,基本操作也可以说就这么几种,在实际应用中,搜索条件的多样性才是重点,我们在进入复杂的搜索之前,先来看一下如何新增和修改文档
445 0
SpringBoot高级篇搜索Solr之文档新增与修改使用姿势
23 个很有用的 ElasticSearch 查询示例
转自:https://coyee.com/article/10764-23-useful-elasticsearch-example-queries
822 0