之前获取 es 是单条“记录”,例如 GetResponse response = client.prepareGet("twitter", "tweet", "1").get(); 如果获取记录列表则要通过“搜索”。最简单的 es 搜索是:
import org.elasticsearch.action.search.SearchResponse; import org.elasticsearch.action.search.SearchType; import org.elasticsearch.index.query.QueryBuilders.*; SearchResponse response = client.prepareSearch().execute().actionGet();// 获取全部
这样太简单了,没有任何条件的搜索,不足以反映 es 的强大。构建一个复杂的搜索,我们需要 SearchRequestBuilder 的帮忙,由它的对象来执行搜索。
SearchRequestBuilder searchRequestBuilder = client.prepareSearch("index1", "index2"); searchRequestBuilder .setTypes("type1", "type2"); // es 的搜索 Search 不但联合多个库(index1、index2),而是可以是跨类型的(即跨表的 type1、type2)。 //设置查询类型 searchRequestBuilder.setSearchType(SearchType.DFS_QUERY_THEN_FETCH); //设置分页信息 searchRequestBuilder.setFrom(0).setSize(10); // 按照时间降序 searchRequestBuilder.addSort("crawlDate", SortOrder.DESC); // 设置是否按查询匹配度排序 searchRequestBuilder.setExplain(true); ……
searchRequestBuilder.setSearchType,设置搜索类型,主要的搜索类型有:
- QUERY_THEN_FETCH:查询是针对所有的块执行的,但返回的是足够的信息,而不是文档内容(Document)。结果会被排序和分级,基于此,只有相关的块的文档对象会被返回。由于被取到的仅仅是这些,故而返回的 hit 的大小正好等于指定的 size。这对于有许多块的 index 来说是很便利的(返回结果不会有重复的,因为块被分组了)
- QUERY_AND_FETCH:最原始(也可能是最快的)实现就是简单的在所有相关的 shard上执行检索并返回结果。每个 shard 返回一定尺寸的结果。由于每个shard已经返回了一定尺寸的hit,这种类型实际上是返回多个 shard的一定尺寸的结果给调用者。
- DFS_QUERY_THEN_FETCH:与 QUERY_THEN_FETCH 相同,预期一个初始的散射相伴用来为更准确的 score 计算分配了的term频率。
- DFS_QUERY_AND_FETCH:与 QUERY_AND_FETCH 相同,预期一个初始的散射相伴用来为更准确的 score 计算分配了的term频率。
- SCAN:在执行了没有进行任何排序的检索时执行浏览。此时将会自动的开始滚动结果集。
- COUNT:只计算结果的数量,也会执行 facet。
继续定义 searchRequestBuilder,
searchRequestBuilder.setQuery(QueryBuilders.termQuery("multi", "test")) // Query 匹配关键字 searchRequestBuilder.setPostFilter(QueryBuilders.rangeQuery("age").from(12).to(18)) // Filter 表示范围
指定查询条件。es 内置丰富的查询条件,我们后面再详述。
最后执行搜索查询,
//执行查询 SearchResponse response = searchRequestBuilder.execute().actionGet(); SearchHits searchHits = response.getHits(); System.out.println("总数:"+searchHits.getTotalHits()); SearchHit[] hits = searchHits.getHits(); for (SearchHit hit : hits) { String json = hit.getSourceAsString(); }
如果换作 HTTP API,可以通过 _search Action 传人 q= 参数进行 QueryString 搜索:
GET /megacorp/employee/_search?q=last_name:Smith // 另外的写法,效果等价 GET /megacorp/employee/_search { "query" : { "match" : { "last_name" : "Smith" } } }