Lucene5学习之TermRangeQuery使用

简介:

    TermRangeQuery是用于字符串范围查询的,既然涉及到范围必然需要字符串比较大小,字符串比较大小其实比较的是ASC码值,即ASC码范围查询。一般对于英文来说,进行ASC码范围查询还有那么一点意义,中文汉字进行ASC码值比较没什么太大意义,所以这个TermRangeQuery了解就行,用途不太大,一般数字范围查询NumericRangeQuery用的比较多一点,比如价格,年龄,金额,数量等等都涉及到数字,数字范围查询需求也很普遍。

    我们来看看官方API里是怎么解释这个Query的:



 意思就是这个Query通过一个范围内的Term来匹配索引文档,这个Query通过一组Term来查找索引文档,哪些Term呢?that后面是解释根据比较byte值落入提供的范围内的Term.但这个Query不适用于数字范围查询,数字范围查询请使用NumericRangeQuery代替。

    下面是TermRangeQuery的使用示例:

    

Java代码   收藏代码
  1. package com.yida.framework.lucene5.query;  
  2.   
  3. import java.io.IOException;  
  4. import java.nio.file.Paths;  
  5. import java.util.ArrayList;  
  6. import java.util.List;  
  7.   
  8. import org.apache.lucene.document.Document;  
  9. import org.apache.lucene.index.DirectoryReader;  
  10. import org.apache.lucene.index.IndexReader;  
  11. import org.apache.lucene.queryparser.classic.ParseException;  
  12. import org.apache.lucene.search.IndexSearcher;  
  13. import org.apache.lucene.search.Query;  
  14. import org.apache.lucene.search.ScoreDoc;  
  15. import org.apache.lucene.search.TermRangeQuery;  
  16. import org.apache.lucene.search.TopDocs;  
  17. import org.apache.lucene.store.FSDirectory;  
  18. import org.apache.lucene.util.BytesRef;  
  19.   
  20. public class TermRangeQueryTest {  
  21.     public static void main(String[] args) throws ParseException, IOException {  
  22.         //参数定义  
  23.         String directoryPath = "D:/lucenedir";  
  24.         String fieldName = "contents";  
  25.         String lowerTermString = "fa";  
  26.         String upperTermString = "fi";  
  27.   
  28.           
  29.         Query query = new TermRangeQuery(fieldName,   
  30.             new BytesRef(lowerTermString),   
  31.             new BytesRef(upperTermString), falsefalse);  
  32.         List<Document> list = query(directoryPath,query);  
  33.         if(list == null || list.size() == 0) {  
  34.             System.out.println("No results found.");  
  35.             return;  
  36.         }  
  37.         for(Document doc : list) {  
  38.             String path = doc.get("path");  
  39.             String content = doc.get("contents");  
  40.             System.out.println("path:" + path);  
  41.             //System.out.println("contents:" + content);  
  42.         }  
  43.     }  
  44.     /** 
  45.      * 创建索引阅读器 
  46.      * @param directoryPath  索引目录 
  47.      * @return 
  48.      * @throws IOException   可能会抛出IO异常 
  49.      */  
  50.     public static IndexReader createIndexReader(String directoryPath) throws IOException {  
  51.         return DirectoryReader.open(FSDirectory.open(Paths.get(directoryPath, new String[0])));  
  52.     }  
  53.       
  54.     /** 
  55.      * 创建索引查询器 
  56.      * @param directoryPath   索引目录 
  57.      * @return 
  58.      * @throws IOException 
  59.      */  
  60.     public static IndexSearcher createIndexSearcher(String directoryPath) throws IOException {  
  61.         return new IndexSearcher(createIndexReader(directoryPath));  
  62.     }  
  63.       
  64.     /** 
  65.      * 创建索引查询器 
  66.      * @param reader 
  67.      * @return 
  68.      */  
  69.     public static IndexSearcher createIndexSearcher(IndexReader reader) {  
  70.         return new IndexSearcher(reader);  
  71.     }  
  72.       
  73.     public static List<Document> query(String directoryPath,Query query) throws IOException {  
  74.         IndexSearcher searcher = createIndexSearcher(directoryPath);  
  75.         TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);  
  76.         List<Document> docList = new ArrayList<Document>();  
  77.         ScoreDoc[] docs = topDocs.scoreDocs;  
  78.         for (ScoreDoc scoreDoc : docs) {  
  79.             int docID = scoreDoc.doc;  
  80.             Document document = searcher.doc(docID);  
  81.             docList.add(document);  
  82.         }  
  83.         searcher.getIndexReader().close();  
  84.         return docList;  
  85.     }  
  86. }  

    TermRangeQuery构造函数如下:

   

Java代码   收藏代码
  1. TermRangeQuery(String field, BytesRef lowerTerm, BytesRef upperTerm, boolean includeLower, boolean includeUpper)   

   BytesRef创建很简单,直接new BytesRef(string)传入一个字符串即可, TermRangeQuery还提供了一个静态方法来构建TermRangeQuery实例:

    

Java代码   收藏代码
  1. /** 
  2.    * Factory that creates a new TermRangeQuery using Strings for term text. 
  3.    */  
  4.   public static TermRangeQuery newStringRange(String field, String lowerTerm, String upperTerm, boolean includeLower, boolean includeUpper) {  
  5.     BytesRef lower = lowerTerm == null ? null : new BytesRef(lowerTerm);  
  6.     BytesRef upper = upperTerm == null ? null : new BytesRef(upperTerm);  
  7.     return new TermRangeQuery(field, lower, upper, includeLower, includeUpper);  
  8.   }  

 其实就是在方法内部帮我们new BytesRef()了,这样接口参数里面对用户的只有用户熟悉的String类型了而没有BytesRef类型了,毕竟用户对BytesRef不是很熟悉,会导致用户在使用API时会有些障碍,所以提供了newStringRange这么一个静态方法,当然如果你自己知道怎么使用默认的构造函数,直接使用构造函数new也可以,只是给用户多了一种选择。

     TermRangeQuery就介绍这么多了,打完收工!

 

      如果你还有什么问题请加我Q-Q:7-3-6-0-3-1-3-0-5,

或者加裙
一起交流学习!

转载:http://iamyida.iteye.com/blog/2194705

目录
相关文章
|
5月前
|
索引
lucene入门使用
lucene入门使用
33 2
|
存储 自然语言处理 算法
Lucene学习总结
Lucene学习总结
104 0
Lucene学习总结
|
关系型数据库 MySQL 数据库
为什么要使用 Lucene|学习笔记
快速学习为什么要使用 Lucene
151 0
为什么要使用 Lucene|学习笔记
|
分布式计算 算法 Hadoop
什么是 lucene|学习笔记
快速学习 什么是 lucene
什么是 lucene|学习笔记
|
索引
lucene学习笔记
lucene学习笔记
138 0
|
开发框架 Java Apache
Lucene|学习笔记
快速学习 Lucene
119 0
|
Java 索引 自然语言处理
|
分布式计算 自然语言处理 Hadoop