一、前言
前几篇文章中,小编给大家介绍了一些es的基本操作,还有常用分词器的搭建,现在给大家来示范一下es的一些常见文档搜索方式。
二、准备工作
在学习文档搜索方式前,我们先来创建一个文档,并添加一些文档数据。
tips: 这里的分词器,我们使用的是上篇文章所说的ik分词器
#创建索引 PUT /students { "mappings":{ "properties":{ "id": { "type": "integer", "index": true }, "name": { "type": "text", "store": true, "index": true, "analyzer": "ik_smart" }, "info": { "type": "text", "store": true, "index": true, "analyzer": "ik_smart" } } } } # 添加数据 POST /students/_doc/ { "id":1, "name":"小白程序员", "info":"I love coding" } POST /students/_doc/ { "id":2, "name":"美羊羊", "info":"美羊羊是羊村最漂亮的人" } POST /students/_doc/ { "id":3, "name":"懒羊羊", "info":"懒羊羊的成绩不是很好" } POST /students/_doc/ { "id":4, "name":"小灰灰", "info":"小灰灰的年纪比较小" } POST /students/_doc/ { "id":5, "name":"沸羊羊", "info":"沸羊羊喜欢美羊羊" } POST /students/_doc/ { "id":6, "name":"灰太狼", "info":"灰太狼是小灰灰的父亲,每次都会说我一定会回来的" }
三、文档搜索
1.查询所有文档
match:
1.全文检索字符,将查询条件分词后再进行搜索
2.还支持模糊查询,具有自动纠错功能(最多纠错两个字,超过则报错)
#格式 { "query":{ "match_all":{} } } eg: 查询全部 GET /students/_search { "query": { "match_all": {} } }
2.根据关键词模糊查询
#eg1:全文检索 match:将查询条件分词后再进行搜索 GET /students/_search { "query": { "match": { "info": "喜欢" } } } #eg2:match还支持模糊查询 还具有自动纠错功能(最多自动纠错两个字符,超过两个报错) GET /students/_search { "query": { "match": { "info": { "query": "lov", "fuzziness": 1 } } } }
3.范围搜索(range)
对数字类型的字符进行范围搜索
,这个和数据库的范围限定符类似。
#格式 { "query":{ "range":{ 搜索字段:{ "gte":最小值, "lte":最大值 } } } } gt/lt:大于/小于 gte/lte:大于等于/小于等于 eg: GET /students/_search { "query": { "range": { "id": { "gte": 1, "lte": 3 } } } }
4.短语检索
搜索条件不做任何分词解析,在搜索字段对应的倒排索引中精确匹配
#格式 { "query":{ "match_phrase":{ 搜索字段:搜索条件 } } } eg: GET /students/_search { "query": { "match_phrase": { "info": "成绩" } } }
5.词组查询term/terms
单词或者词组搜索,不做任何分词解析,在搜索字段对应的倒排索引中精确匹配
#格式 { "query":{ "term":{ 搜索字段: 搜索条件 } } } { "query":{ "terms":{ 搜索字段: [搜索条件1,搜索条件2] } } }
6.复合搜索
es也是可以像Java语言那样,可以将多个条件嵌套使用,从而筛选出符合条件的那一个。
#格式 GET /索引/_search { "query": { "bool": { // 必须满足的条件 "must": [ 搜索方式:搜索参数, 搜索方式:搜索参数 ], // 多个条件有任意一个满足即可 "should": [ 搜索方式:搜索参数, 搜索方式:搜索参数 ], // 必须不满足的条件 "must_not":[ 搜索方式:搜索参数, 搜索方式:搜索参数 ] } } } eg: GET /students/_search { "query": { "bool": { "must_not": [ { "term": { "info": "成绩" } }, { "range": { "id": { "gte": 1, "lte": 3 } } } ] } } }
上面就是查询出id在1到3范围内,且info里面含有成绩字样的student
7.结果排序
es默认使用相关度分数实现排序,也可以通过搜索语法定制化排序
#格式 GET /索引/_search { "query": 搜索条件, "sort": [ { "字段1":{ "order":"asc" } }, { "字段2":{ "order":"desc" } } ] } eg: #1根据匹配度排序,高的在前面 GET /students/_search { "query": { "match": { "info": "我喜欢成绩好的学生" } } } #2根据搜索语法定制化排序 GET /students/_search { "query": { "match": { "info": "我喜欢淑仪" } }, "sort": [ { "id": { "order": "desc" } } ] }
tips:es默认不会对text类型的字段做排序(因为会分词),如果需要使用text类型的字段做结果排序,可以使用keyword类型的字段作为排序依据(因为keyword类型的字段不会做分词处理)
8.分页查询
这个顾名思义就是当查询内容过多的时候,可以将其分成几页,每页限定规定的数量进行查询。
#格式 GET /索引/_search { "query": 搜索条件, "from": 起始下标, "size": 查询记录数 } eg: GET /students/_search { "query":{ "match_all":{} }, "from":0, "size":3 }
9.sql查询
在es里面使用sql语句对文档进行查询(没啥用)
#格式 GET /_sql?format=txt { "query": SQL语句 } eg: GET /_sql?format=txt { "query": "select *from students" }
四、总结
介绍了一些elasticsearch的常见文档搜索方式,结合前几篇文章学习,可以很好地入门es,希望你有所收获。