ElasticSearch中DSL高级检索(Query)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: ElasticSearch中DSL高级检索(Query)

ElasticSearch中DSL高级检索(Query)

es分布式搜索引擎 作用:搜索 全文检索


ES官方提供了两中检索方式:一种是通过 URL 参数进行搜索,另一种是通过 DSL(Domain Specified Language) 进行搜索``。``官方更推荐使用第二种方式第二种方式是基于传递JSON作为请求体(request body)格式与ES进行交互,这种方式更强大,更简洁``。


1、检索方式 _search

官方提供两种检索方式:


(1)QueryString Query 字符串查询

URL查询 :GET/索引/类型/_search?数据 【传统url】


image.png


(2)QueryDSL 特定领域语言查询

** DQL查询(request body):** GET /索引/类型/_search {json} 【resultful url】


image.png



QueryString 字符串查询 传统参数?拼接【传统URL】
   查询所有(默认10条):Get /索引名/类型名/_search?q=*  
   查询索引(自定义条数):Get /索引名/类型名/_search?q=*&size=20&from=0
QueryDSL: 特定领域语言查询 传递数据 请求体中使用json的形式传递
requestBody的形式
Get /索引名/类型名/_search
{
"query":{"match_all":{}}//查询所有
 "size":20  //指定展示的条数
 "from":0  //从第几条开始展示1--0 2---1
 "sort":[
 {
    "age":{
        "order":"asc升|desc"
    }
 }
 ]
}

二、DSL高级检索(Query)

0. 查询所有(match_all)

match_all关键字: 返回索引中的全部文档


GET /ems/emp/_search
{
   "query": { "match_all": {} }
}  

1. 查询结果中返回指定条数(size)

size 关键字 : 指定查询结果中返回指定条数。 默认返回值10条


GET /ems/emp/_search
{
   "query": { "match_all": {} },
  "size": 1
}  

2. 分页查询(from)

from 关键字 : 用来指定起始返回位置,和size关键字连用可实现分页效果


GET /ems/emp/_search
{
      "query": {"match_all": {}},
      "sort": [
        {
          "age": {
            "order": "desc"
          }
        }
      ],
      "size": 2, 
      "from": 1
}

3. 查询结果中返回指定字段(_source)

_source 关键字 : 是一个数组,在数组中用来指定展示那些字段


GET /ems/emp/_search
{
      "query": { "match_all": {} },
      "_source": ["account_number", "balance"]
}

4. 关键词查询(term)

term 关键字 : 用来使用关键词查询


GET /ems/emp/_search
{
  "query": {
    "term": {
      "address": {
        "value": "北京"
      }
    }
  }
}
#1、只对text类型的数据进行分词
    integer.keyWard lang double boolean ip 类型都不参与分词
#2、标准分词器分词时对中文单字分词 对英文单词分词    

NOTE1: 通过使用term查询知ES中默认使用分词器为标准分词器(StandardAnalyzer),标准分词器对于英文单词分词,对于中文单字分词 。


NOTE2: 通过使用term查询得知,在ES的Mapping Type 中 keyword , date ,integer, long , double , boolean or ip 这些类型不分词 ,只有text类型分词 。

image.png



关键字查询底层实现原理

image.png


5. 范围查询(range)

range 关键字 : 用来指定查询指定范围内的文档


#range 范围查询 根据年龄搜索 0-10 等价于关系型数据库的betweend--and
# gte:大于等于  gt:大于 lt:小于 lte:小于等于
GET /ems/emp/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 0,
        "lte": 10
      }
    }
  }
}

6. 前缀查询(prefix)

prefix 关键字 : 用来检索含有指定前缀的关键词的相关文档



# 前缀查询(prewfix) like "x%"
GET /ems/emp/_search
{
  "query": {
    "prefix": {
      "address": {
        "value": "北"
      }
    }
  }
}

7. 通配符查询(wildcard)

wildcard 关键字 : 通配符查询 ? 用来匹配一个任意字符 * 用来匹配多个任意字符


#通配符查询(wildcard)
# ?匹配一个字符 *可以匹配多个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "re*"
      }
    }
  }
}
# ?匹配一个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "sprin?"
      }
    }
  }
}

8. 多id查询(ids)

ids 关键字 : 值为数组类型,用来根据一组id获取多个对应的文档


#多id查询
GET /ems/emp/_search
{
  "query": {
    "ids": {
      "values": ["dPMrnX0BfC_D9Fr1AcjP","c_MrnX0BfC_D9Fr1AcjP"]
    }
  }
}

9. 模糊查询(fuzzy)

fuzzy 关键字 : 用来模糊查询含有指定关键字的文档


#fuzzy 模糊查询  用来模糊查询含有指定关键字的文档
#规则:
# 搜索关键词长度为2 不允许存在模糊
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "北京"
    }
  }
}
# 搜索关键词长度为3~5 允许一次模糊 把mvc写成mvx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content":"mvx"
    }
  }
}
# 搜索关键词长度为5以上  允许最大模糊数2个 将spring写成xprinx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "xprinx"
    }
  }
fuzzy 模糊查询  最大模糊错误 必须在0-2之间
# 搜索关键词长度为 2  不允许存在模糊 0
# 搜索关键词长度为3-5 允许一次模糊   0 1 
# 搜索关键词长度大于5 允许最大2模糊

image.png


10. 布尔查询(bool)

bool 关键字 : 用来组合多个条件实现复杂查询


must: 相当于&& 同时成立


should: 相当于|| 成立一个就行


must_not: 相当于! 不能满足任何一个


#bool 布尔查询 && || !
# bool关键字 用来组合多个条件实现复杂查询
#must 相当于&&同时成立
#should 相当于||成立一个
# must_not :相当于! 不满足任何一个条件
GET /ems/emp/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "content": {
              "value": "框"
            }
          }
        }
      ],"must_not": [
        {"term": {
          "name": {
            "value": "黑"
          }
        }}
      ],
      "should": [
        {
          "ids": {
            "values": ["c_MrnX0BfC_D9Fr1AcjP"]
          }
        }
      ]
    }
  }
}

11. 高亮查询(highlight)

highlight 关键字 : 可以让符合条件的文档中的关键词高亮


GET /ems/emp/_search
{
  "query": {
    "term": {
      "content": {
        "value": "redis"
      }
    }
  },
  "highlight": {
    "fields": {
      "*": {}
    }
  } 
}

自定义高亮html标签 : 可以在highlight中使用pre_tags和post_tags


GET /ems/emp/_search
{
  "query":{
    "term":{
      "content":"框架"
    }
  },
  "highlight": {
    "pre_tags": ["<span style='color:red'>"],
    "post_tags": ["</span>"],
    "fields": {
      "*":{}
    }
  }
}

多字段高亮 使用require_field_match开启多个字段高亮


12. 多字段查询(multi_match)

#查询所有
GET /ems/emp/_search?q=*
#multi_match 多字段查询
GET /ems/emp/_search
{
  "query": {
  "multi_match": {
    "query": "框",
    #这里写要检索的指定字段
    "fields": ["name","content"] 
  }
  }
}

13. 多字段分词查询(query_string)

#query_string 多字段分词查询
GET /ems/emp/_search
{
  "query": {
    "query_string": {
      "query": "框架黑",
      "fields": ["name","content"]
    }
  }
}
相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
4月前
|
SQL JSON 大数据
ElasticSearch的简单介绍与使用【进阶检索】 实时搜索 | 分布式搜索 | 全文搜索 | 大数据处理 | 搜索过滤 | 搜索排序
这篇文章是Elasticsearch的进阶使用指南,涵盖了Search API的两种检索方式、Query DSL的基本语法和多种查询示例,包括全文检索、短语匹配、多字段匹配、复合查询、结果过滤、聚合操作以及Mapping的概念和操作,还讨论了Elasticsearch 7.x和8.x版本中type概念的变更和数据迁移的方法。
ElasticSearch的简单介绍与使用【进阶检索】 实时搜索 | 分布式搜索 | 全文搜索 | 大数据处理 | 搜索过滤 | 搜索排序
|
4月前
|
存储 API 数据库
检索服务elasticsearch索引(Index)
【8月更文挑战第23天】
68 6
|
4月前
|
存储 负载均衡 监控
检索服务elasticsearch节点(Node)
【8月更文挑战第23天】
62 5
|
4月前
|
存储 监控 负载均衡
检索服务elasticsearch集群(Cluster)
【8月更文挑战第23天】
65 3
|
4月前
|
网络协议 Java API
SpringBoot整合Elasticsearch-Rest-Client、测试保存、复杂检索
这篇文章介绍了如何在SpringBoot中整合Elasticsearch-Rest-Client,并提供了保存数据和进行复杂检索的测试示例。
SpringBoot整合Elasticsearch-Rest-Client、测试保存、复杂检索
|
3月前
|
存储 自然语言处理 关系型数据库
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
聚合、补全、RabbitMQ消息同步、集群、脑裂问题、集群分布式存储、黑马旅游实现过滤和搜索补全功能
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
|
3月前
|
JSON 自然语言处理 算法
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
DSL查询文档、RestClient查询文档、全文检索查询、精准查询、复合查询、地理坐标查询、分页、排序、高亮、黑马旅游案例
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
|
4月前
|
SQL 存储 自然语言处理
检索服务elasticsearch全文搜索
【8月更文挑战第22天】
61 3
|
4月前
|
SQL 存储 监控
检索服务elasticsearch
【8月更文挑战第21天】
38 0
|
4月前
|
存储 缓存 监控
Elasticsearch Filter 缓存加速检索的细节,你知道吗?
【8月更文挑战第15天】在大数据与搜索引擎的广阔天地里,Elasticsearch 凭借其强大的全文搜索能力和可扩展性,成为了众多企业和开发者的首选。而在Elasticsearch的性能优化中,Filter缓存(也称为Filter Cache,自Elasticsearch 7.x版本后更名为Query Cache的一部分)扮演着至关重要的角色。今天,我们就来深入探讨一下Elasticsearch Filter缓存如何加速检索过程,以及在日常工作学习中如何有效利用这一特性。
77 0