【ElasticSearch从入门到放弃系列 十一】Elasticsearch常用查询方式讨论及实践(四)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 【ElasticSearch从入门到放弃系列 十一】Elasticsearch常用查询方式讨论及实践(四)

must使用

文档必须匹配must查询条件,我们这里设置要查询的内容为【年龄在10-19岁之间 且 性别为男 且 姓名开头为森】的员工,查询语句为:

{"query":{
    "bool": {
      "must": [
        {"term": {"sex": "男"}},
        {"range": {"age": { "gte" : 18, "lt"  : 29}}},
        {"prefix": {"name": "森"}}
      ]
    }
  }
}

返回结果为:

{
    "took": 54,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 2,
            "relation": "eq"
        },
        "max_score": 2.6931472,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "1",
                "_score": 2.6931472,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "森小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "2",
                "_score": 2.575364,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "森小林"
                }
            }
        ]
    }
}

should使用

文档应该匹配should子句查询的一个或多个,这里我们来查询【年龄在10-19岁之间 或 性别为男 或 姓名开头为森】,查询语句为:

{"query":{
    "bool": {
      "should": [
        {"term": {"sex": "男"}},
        {"range": {"age": { "gte" : 18, "lt"  : 29}}},
        {"prefix": {"name": "森"}}
      ]
    }
  }
}

返回结果为:

{
    "took": 48,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 14,
            "relation": "eq"
        },
        "max_score": 2.597837,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "1",
                "_score": 2.597837,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "森小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "2",
                "_score": 2.4418328,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "森小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "9",
                "_score": 2.0,
                "_source": {
                    "age": 18,
                    "sex": "女",
                    "name": "森小玲"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "11",
                "_score": 2.0,
                "_source": {
                    "age": 28,
                    "sex": "女",
                    "name": "森小捷"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "5",
                "_score": 1.9808291,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "李小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "6",
                "_score": 1.597837,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "李小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "3",
                "_score": 1.4418328,
                "_source": {
                    "age": 8,
                    "sex": "男",
                    "name": "森小贤"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "12",
                "_score": 1.4418328,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "李小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "13",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "女",
                    "name": "李小男"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "15",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "woman",
                    "name": "赵小男"
                }
            }
        ]
    }
}

可以看到只有一条数据没有返回,因为不符合shoud的任意一个条件

must_not使用

文档不能匹配该查询条件,这里我们来查询【年龄不在10-19岁之间 且 性别不为男 且 姓名开头不为森】,查询语句为:

{"query":{
    "bool": {
      "must_not": [
        {"term": {"sex": "男"}},
        {"range": {"age": { "gte" : 18, "lt"  : 29}}},
        {"prefix": {"name": "森"}}
      ]
    }
  }
}

我们可以看到,返回结果刚好为shoud的相反条件:

{
    "took": 17,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 1,
            "relation": "eq"
        },
        "max_score": 0.0,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "7",
                "_score": 0.0,
                "_source": {
                    "age": 8,
                    "sex": "女",
                    "name": "李小美"
                }
            }
        ]
    }
}

filter使用

过滤器,文档必须匹配该过滤条件,跟must子句的唯一区别是,filter不影响查询的score,我们这里设置要查询的内容为【年龄在10-19岁之间 且 性别为男 且 姓名开头为森】的员工,查询语句为:

{"query":{
    "bool": {
      "filter": [
        {"term": {"sex": "男"}},
        {"range": {"age": { "gte" : 18, "lt"  : 29}}},
        {"prefix": {"name": "森"}}
      ]
    }
  }
}

返回结果为:

{
    "took": 7,             // 请求花了多少时间                      
    "timed_out": false,    //有没有超时
    "_shards": {           //执行请求时查询的分片信息                             
        "total": 3,            //查询的分片数量         
        "successful": 3,      // 成功返回结果的分片数量
        "skipped": 0,          // 跳过的分片数量
        "failed": 0                // 失败的分片数量
    },
    "hits": {                         
        "total": {
            "value": 2,                        //查询返回的文档总数
            "relation": "eq"                       
        },
        "max_score": 0.0,                //计算所得的最高分
        "hits": [
            {
                "_index": "tml-userinfo",    //索引
                "_type": "_doc",                 //类型
                "_id": "2",                        //标识符
                "_score": 0.0,                  //得分
                "_source": {                            //发送到索引的Json对象
                    "age": 28,
                    "sex": "男",
                    "name": "森小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "1",
                "_score": 0.0,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "森小辰"
                }
            }
        ]
    }
}

可以看到,返回的score为0,但是took为7,比must的54快了近8倍多。

多子句复合查询

我们在真实使用复合查询的时候肯定不仅仅要查单种条件的复合关系,还需要查多种关联条件,这里我们查一个【年龄在10-19岁之间 且 性别为男 且 姓名开头为森】或【姓名以男字结尾】但【年龄不能是28岁的】,需要注意:Boolean在同时有must和should的时候,should就被过滤掉了,因为should表示有也可以没有也可以,所以我们常把must放到should字句里,确保should的子句能执行

{
    "query": {
        "bool": {
            "should": [
                {
                    "wildcard": {
                        "name": "*男"
                    }
                },
                {
                    "bool": {
                        "must": [
                            {
                                "term": {
                                    "sex": "男"
                                }
                            },
                            {
                                "range": {
                                    "age": {
                                        "gte": 18,
                                        "lt": 29
                                    }
                                }
                            },
                            {
                                "prefix": {
                                    "name": "森"
                                }
                            }
                        ]
                    }
                }
            ],
            "must_not": [
                {
                    "term": {
                        "age": 28
                    }
                }
            ]
        }
    }
}

返回结果如下:

{
    "took": 14,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 4,
            "relation": "eq"
        },
        "max_score": 2.6931472,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "1",
                "_score": 2.6931472,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "森小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "13",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "女",
                    "name": "李小男"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "14",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "",
                    "name": "李小男"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "15",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "woman",
                    "name": "赵小男"
                }
            }
        ]
    }
}

整个过程是先做should操作(must作为其子句),操作完后再用must_not把当前结果集中的数据干掉。


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
存储 固态存储 Java
Elasticsearch中查询性能优化
Elasticsearch中查询性能优化
196 0
|
3月前
|
安全 Linux 开发工具
Elasticsearch 搜索入门技术之一
Elasticsearch 搜索入门技术之一
227 1
|
2月前
|
存储 关系型数据库 MySQL
ElasticSearch 入门
【2月更文挑战第7天】ElasticSearch 入门 简介 ElasticSearch 的基本概念 ElasticSearch 的查询流程 ElasticSearch 的更新流程
37 2
|
2月前
|
缓存 算法 索引
【Elasticsearch专栏 07】深入探索:Elasticsearch的倒排索引如何进行模糊查询和通配符查询
Elasticsearch的倒排索引支持模糊查询和通配符查询,通过特定的算法和数据结构,能够实现对关键词的模糊匹配和通配符匹配。这两种查询类型提供了更灵活的搜索功能,但可能影响查询性能,需结合优化策略使用。
|
2月前
|
存储 自然语言处理 搜索推荐
ElasticSearch入门篇
ElasticSearch入门篇
|
2月前
|
存储 JSON 测试技术
异步检索在 Elasticsearch 中的理论与实践
异步检索在 Elasticsearch 中的理论与实践
36 0
|
2月前
|
缓存 自然语言处理 数据挖掘
一篇文章让你学会Elasticsearch中的查询
一篇文章让你学会Elasticsearch中的查询
137312 118
|
2月前
|
测试技术 定位技术 API
万字长文:一文彻底搞懂Elasticsearch中Geo数据类型查询、聚合、排序
万字长文:一文彻底搞懂Elasticsearch中Geo数据类型查询、聚合、排序
94614 140
|
2月前
|
JSON 前端开发 API
【Elasticsearch】搜索结果处理和RestClient查询文档
【Elasticsearch】搜索结果处理和RestClient查询文档
338 0
|
2月前
|
JSON 自然语言处理 算法
【Elasticsearch】DSL查询文档
【Elasticsearch】DSL查询文档
315 0

热门文章

最新文章