ElasticSearch中DSL高级检索(Query)
es分布式搜索引擎 作用:搜索 全文检索
ES官方提供了两中检索方式:一种是通过 URL 参数进行搜索,另一种是通过 DSL(Domain Specified Language) 进行搜索``。``官方更推荐使用第二种方式第二种方式是基于传递JSON作为请求体(request body)格式与ES进行交互,这种方式更强大,更简洁``。
1、检索方式 _search
官方提供两种检索方式:
(1)QueryString Query 字符串查询
URL查询 :GET/索引/类型/_search?数据 【传统url】
(2)QueryDSL 特定领域语言查询
** DQL查询(request body):** GET /索引/类型/_search {json} 【resultful url】
QueryString 字符串查询 传统参数?拼接【传统URL】 查询所有(默认10条):Get /索引名/类型名/_search?q=* 查询索引(自定义条数):Get /索引名/类型名/_search?q=*&size=20&from=0
QueryDSL: 特定领域语言查询 传递数据 请求体中使用json的形式传递 requestBody的形式 Get /索引名/类型名/_search { "query":{"match_all":{}}//查询所有 "size":20 //指定展示的条数 "from":0 //从第几条开始展示1--0 2---1 "sort":[ { "age":{ "order":"asc升|desc" } } ] }
二、DSL高级检索(Query)
0. 查询所有(match_all)
match_all关键字: 返回索引中的全部文档
GET /ems/emp/_search { "query": { "match_all": {} } }
1. 查询结果中返回指定条数(size)
size 关键字 : 指定查询结果中返回指定条数。 默认返回值10条
GET /ems/emp/_search { "query": { "match_all": {} }, "size": 1 }
2. 分页查询(from)
from 关键字 : 用来指定起始返回位置,和size关键字连用可实现分页效果
GET /ems/emp/_search { "query": {"match_all": {}}, "sort": [ { "age": { "order": "desc" } } ], "size": 2, "from": 1 }
3. 查询结果中返回指定字段(_source)
_source 关键字 : 是一个数组,在数组中用来指定展示那些字段
GET /ems/emp/_search { "query": { "match_all": {} }, "_source": ["account_number", "balance"] }
4. 关键词查询(term)
term 关键字 : 用来使用关键词查询
GET /ems/emp/_search { "query": { "term": { "address": { "value": "北京" } } } } #1、只对text类型的数据进行分词 integer.keyWard lang double boolean ip 类型都不参与分词 #2、标准分词器分词时对中文单字分词 对英文单词分词
NOTE1: 通过使用term查询知ES中默认使用分词器为标准分词器(StandardAnalyzer),标准分词器对于英文单词分词,对于中文单字分词 。
NOTE2: 通过使用term查询得知,在ES的Mapping Type 中 keyword , date ,integer, long , double , boolean or ip 这些类型不分词 ,只有text类型分词 。
关键字查询底层实现原理
5. 范围查询(range)
range 关键字 : 用来指定查询指定范围内的文档
#range 范围查询 根据年龄搜索 0-10 等价于关系型数据库的betweend--and # gte:大于等于 gt:大于 lt:小于 lte:小于等于 GET /ems/emp/_search { "query": { "range": { "age": { "gte": 0, "lte": 10 } } } }
6. 前缀查询(prefix)
prefix 关键字 : 用来检索含有指定前缀的关键词的相关文档
# 前缀查询(prewfix) like "x%" GET /ems/emp/_search { "query": { "prefix": { "address": { "value": "北" } } } }
7. 通配符查询(wildcard)
wildcard 关键字 : 通配符查询 ? 用来匹配一个任意字符 * 用来匹配多个任意字符
#通配符查询(wildcard) # ?匹配一个字符 *可以匹配多个字符 GET /ems/emp/_search { "query": { "wildcard": { "content": { "value": "re*" } } } } # ?匹配一个字符 GET /ems/emp/_search { "query": { "wildcard": { "content": { "value": "sprin?" } } } }
8. 多id查询(ids)
ids 关键字 : 值为数组类型,用来根据一组id获取多个对应的文档
#多id查询 GET /ems/emp/_search { "query": { "ids": { "values": ["dPMrnX0BfC_D9Fr1AcjP","c_MrnX0BfC_D9Fr1AcjP"] } } }
9. 模糊查询(fuzzy)
fuzzy 关键字 : 用来模糊查询含有指定关键字的文档
#fuzzy 模糊查询 用来模糊查询含有指定关键字的文档 #规则: # 搜索关键词长度为2 不允许存在模糊 GET /ems/emp/_search { "query": { "fuzzy": { "content": "北京" } } } # 搜索关键词长度为3~5 允许一次模糊 把mvc写成mvx GET /ems/emp/_search { "query": { "fuzzy": { "content":"mvx" } } } # 搜索关键词长度为5以上 允许最大模糊数2个 将spring写成xprinx GET /ems/emp/_search { "query": { "fuzzy": { "content": "xprinx" } } fuzzy 模糊查询 最大模糊错误 必须在0-2之间 # 搜索关键词长度为 2 不允许存在模糊 0 # 搜索关键词长度为3-5 允许一次模糊 0 1 # 搜索关键词长度大于5 允许最大2模糊
10. 布尔查询(bool)
bool 关键字 : 用来组合多个条件实现复杂查询
must: 相当于&& 同时成立
should: 相当于|| 成立一个就行
must_not: 相当于! 不能满足任何一个
#bool 布尔查询 && || ! # bool关键字 用来组合多个条件实现复杂查询 #must 相当于&&同时成立 #should 相当于||成立一个 # must_not :相当于! 不满足任何一个条件 GET /ems/emp/_search { "query": { "bool": { "must": [ { "term": { "content": { "value": "框" } } } ],"must_not": [ {"term": { "name": { "value": "黑" } }} ], "should": [ { "ids": { "values": ["c_MrnX0BfC_D9Fr1AcjP"] } } ] } } }
11. 高亮查询(highlight)
highlight 关键字 : 可以让符合条件的文档中的关键词高亮
GET /ems/emp/_search { "query": { "term": { "content": { "value": "redis" } } }, "highlight": { "fields": { "*": {} } } }
自定义高亮html标签 : 可以在highlight中使用pre_tags和post_tags
GET /ems/emp/_search { "query":{ "term":{ "content":"框架" } }, "highlight": { "pre_tags": ["<span style='color:red'>"], "post_tags": ["</span>"], "fields": { "*":{} } } }
多字段高亮 使用require_field_match开启多个字段高亮
12. 多字段查询(multi_match)
#查询所有 GET /ems/emp/_search?q=* #multi_match 多字段查询 GET /ems/emp/_search { "query": { "multi_match": { "query": "框", #这里写要检索的指定字段 "fields": ["name","content"] } } }
13. 多字段分词查询(query_string)
#query_string 多字段分词查询 GET /ems/emp/_search { "query": { "query_string": { "query": "框架黑", "fields": ["name","content"] } } }