【ElasticSearch从入门到放弃系列 十一】Elasticsearch常用查询方式讨论及实践(三)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 【ElasticSearch从入门到放弃系列 十一】Elasticsearch常用查询方式讨论及实践(三)

wildcard

通配符查询,其中【?】代表任意一个字符【*】代表任意的一个或多个字符,例如我们想查名字结尾为的文档:

{
    "query": {
         "wildcard": {
            "name": "*林"
          }
    }
}

返回结果为:

{
    "took": 19,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 3,
            "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "5",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "李小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "2",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "森小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "6",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "李小林"
                }
            }
        ]
    }
}

prefix

前缀查询,我们为了找到所有姓名以开头的文档,可以使用这种方式:

{
    "query": {
         "prefix": {
            "name": "森"
          }
    }
}

返回结果为:

{
    "took": 4,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 6,
            "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "2",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "森小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "3",
                "_score": 1.0,
                "_source": {
                    "age": 8,
                    "sex": "男",
                    "name": "森小贤"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "1",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "森小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "8",
                "_score": 1.0,
                "_source": {
                    "age": 8,
                    "sex": "女",
                    "name": "森小美"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "9",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "女",
                    "name": "森小玲"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "11",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "女",
                    "name": "森小捷"
                }
            }
        ]
    }
}

regexp

顾明思意,ES兼容了正则的查询方式,例如我们想查询性别为汉字字符的文档,为了验证,所以我们插入一条数据:

查询语句为

{
    "query": {
         "regexp": {
            "sex": "[\u4e00-\u9fa5]"
          }
    }
}

检索结果为13条,除了性别为空的和英文的都检索到了

{
    "took": 9,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 13,
            "relation": "eq"
        },
        "max_score": 1.0,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "5",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "李小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "7",
                "_score": 1.0,
                "_source": {
                    "age": 8,
                    "sex": "女",
                    "name": "李小美"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "13",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "女",
                    "name": "李小男"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "2",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "森小林"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "3",
                "_score": 1.0,
                "_source": {
                    "age": 8,
                    "sex": "男",
                    "name": "森小贤"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "4",
                "_score": 1.0,
                "_source": {
                    "age": 8,
                    "sex": "男",
                    "name": "李小贤"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "10",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "女",
                    "name": "李小玲"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "12",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "李小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "1",
                "_score": 1.0,
                "_source": {
                    "age": 18,
                    "sex": "男",
                    "name": "森小辰"
                }
            },
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "6",
                "_score": 1.0,
                "_source": {
                    "age": 28,
                    "sex": "男",
                    "name": "李小林"
                }
            }
        ]
    }
}

fuzzy

fuzzy 纠错检索,让输入条件有容错性,例如我要检索性别为woman的数据,但是我拼错了,输入的是wman,用fuzzy照样可以检索到:

{
    "query": {
         "fuzzy": {
            "sex": "wman"
          }
    }
}

返回结果为:

{
    "took": 26,
    "timed_out": false,
    "_shards": {
        "total": 3,
        "successful": 3,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 1,
            "relation": "eq"
        },
        "max_score": 1.2554823,
        "hits": [
            {
                "_index": "tml-userinfo",
                "_type": "_doc",
                "_id": "15",
                "_score": 1.2554823,
                "_source": {
                    "age": 18,
                    "sex": "woman",
                    "name": "赵小男"
                }
            }
        ]
    }
}

复合查询

复合查询通俗的说就是多个条件拼接查询,就是用Bool去拼接一系列的查询条件,来完成表达式的查询方式,其实就是将普通条件进行重新组合,常用的有四种复合类型:

  • filter:只过滤符合条件的文档,不计算相关系得分,但因为有缓存,所以性能高
  • must:用must连接的多个条件必须都满足,是and的关系,逻辑&与的关系。
  • should:用should连接的多个条件只要满足一个即可,是or的关系,逻辑||或的关系
  • must_not:用must_not绑定的条件表示一定不能满足该条件,是not的关系,逻辑^非的关系。

用这些条件的连接词将多个查询条件连接起来就能进行复杂的复合查询了。

以下是一个bool过滤器的组成格式

{
   "bool" : {
      "must" :     [],
      "should" :   [],
      "must_not" : [],
      "filter":    []
   }
}



相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
存储 固态存储 Java
Elasticsearch中查询性能优化
Elasticsearch中查询性能优化
196 0
|
3月前
|
安全 Linux 开发工具
Elasticsearch 搜索入门技术之一
Elasticsearch 搜索入门技术之一
227 1
|
2月前
|
存储 关系型数据库 MySQL
ElasticSearch 入门
【2月更文挑战第7天】ElasticSearch 入门 简介 ElasticSearch 的基本概念 ElasticSearch 的查询流程 ElasticSearch 的更新流程
37 2
|
2月前
|
缓存 算法 索引
【Elasticsearch专栏 07】深入探索:Elasticsearch的倒排索引如何进行模糊查询和通配符查询
Elasticsearch的倒排索引支持模糊查询和通配符查询,通过特定的算法和数据结构,能够实现对关键词的模糊匹配和通配符匹配。这两种查询类型提供了更灵活的搜索功能,但可能影响查询性能,需结合优化策略使用。
|
2月前
|
存储 自然语言处理 搜索推荐
ElasticSearch入门篇
ElasticSearch入门篇
|
2月前
|
存储 JSON 测试技术
异步检索在 Elasticsearch 中的理论与实践
异步检索在 Elasticsearch 中的理论与实践
36 0
|
2月前
|
缓存 自然语言处理 数据挖掘
一篇文章让你学会Elasticsearch中的查询
一篇文章让你学会Elasticsearch中的查询
137316 118
|
2月前
|
测试技术 定位技术 API
万字长文:一文彻底搞懂Elasticsearch中Geo数据类型查询、聚合、排序
万字长文:一文彻底搞懂Elasticsearch中Geo数据类型查询、聚合、排序
94614 140
|
2月前
|
JSON 前端开发 API
【Elasticsearch】搜索结果处理和RestClient查询文档
【Elasticsearch】搜索结果处理和RestClient查询文档
338 0
|
2月前
|
JSON 自然语言处理 算法
【Elasticsearch】DSL查询文档
【Elasticsearch】DSL查询文档
317 0

热门文章

最新文章