ElasticSearch中DSL高级检索(Query)

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: ElasticSearch中DSL高级检索(Query)

ElasticSearch中DSL高级检索(Query)

es分布式搜索引擎 作用:搜索 全文检索


ES官方提供了两中检索方式:一种是通过 URL 参数进行搜索,另一种是通过 DSL(Domain Specified Language) 进行搜索``。``官方更推荐使用第二种方式第二种方式是基于传递JSON作为请求体(request body)格式与ES进行交互,这种方式更强大,更简洁``。


1、检索方式 _search

官方提供两种检索方式:


(1)QueryString Query 字符串查询

URL查询 :GET/索引/类型/_search?数据 【传统url】


image.png


(2)QueryDSL 特定领域语言查询

** DQL查询(request body):** GET /索引/类型/_search {json} 【resultful url】


image.png



QueryString 字符串查询 传统参数?拼接【传统URL】
   查询所有(默认10条):Get /索引名/类型名/_search?q=*  
   查询索引(自定义条数):Get /索引名/类型名/_search?q=*&size=20&from=0
QueryDSL: 特定领域语言查询 传递数据 请求体中使用json的形式传递
requestBody的形式
Get /索引名/类型名/_search
{
"query":{"match_all":{}}//查询所有
 "size":20  //指定展示的条数
 "from":0  //从第几条开始展示1--0 2---1
 "sort":[
 {
    "age":{
        "order":"asc升|desc"
    }
 }
 ]
}

二、DSL高级检索(Query)

0. 查询所有(match_all)

match_all关键字: 返回索引中的全部文档


GET /ems/emp/_search
{
   "query": { "match_all": {} }
}  

1. 查询结果中返回指定条数(size)

size 关键字 : 指定查询结果中返回指定条数。 默认返回值10条


GET /ems/emp/_search
{
   "query": { "match_all": {} },
  "size": 1
}  

2. 分页查询(from)

from 关键字 : 用来指定起始返回位置,和size关键字连用可实现分页效果


GET /ems/emp/_search
{
      "query": {"match_all": {}},
      "sort": [
        {
          "age": {
            "order": "desc"
          }
        }
      ],
      "size": 2, 
      "from": 1
}

3. 查询结果中返回指定字段(_source)

_source 关键字 : 是一个数组,在数组中用来指定展示那些字段


GET /ems/emp/_search
{
      "query": { "match_all": {} },
      "_source": ["account_number", "balance"]
}

4. 关键词查询(term)

term 关键字 : 用来使用关键词查询


GET /ems/emp/_search
{
  "query": {
    "term": {
      "address": {
        "value": "北京"
      }
    }
  }
}
#1、只对text类型的数据进行分词
    integer.keyWard lang double boolean ip 类型都不参与分词
#2、标准分词器分词时对中文单字分词 对英文单词分词    

NOTE1: 通过使用term查询知ES中默认使用分词器为标准分词器(StandardAnalyzer),标准分词器对于英文单词分词,对于中文单字分词 。


NOTE2: 通过使用term查询得知,在ES的Mapping Type 中 keyword , date ,integer, long , double , boolean or ip 这些类型不分词 ,只有text类型分词 。

image.png



关键字查询底层实现原理

image.png


5. 范围查询(range)

range 关键字 : 用来指定查询指定范围内的文档


#range 范围查询 根据年龄搜索 0-10 等价于关系型数据库的betweend--and
# gte:大于等于  gt:大于 lt:小于 lte:小于等于
GET /ems/emp/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 0,
        "lte": 10
      }
    }
  }
}

6. 前缀查询(prefix)

prefix 关键字 : 用来检索含有指定前缀的关键词的相关文档



# 前缀查询(prewfix) like "x%"
GET /ems/emp/_search
{
  "query": {
    "prefix": {
      "address": {
        "value": "北"
      }
    }
  }
}

7. 通配符查询(wildcard)

wildcard 关键字 : 通配符查询 ? 用来匹配一个任意字符 * 用来匹配多个任意字符


#通配符查询(wildcard)
# ?匹配一个字符 *可以匹配多个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "re*"
      }
    }
  }
}
# ?匹配一个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "sprin?"
      }
    }
  }
}

8. 多id查询(ids)

ids 关键字 : 值为数组类型,用来根据一组id获取多个对应的文档


#多id查询
GET /ems/emp/_search
{
  "query": {
    "ids": {
      "values": ["dPMrnX0BfC_D9Fr1AcjP","c_MrnX0BfC_D9Fr1AcjP"]
    }
  }
}

9. 模糊查询(fuzzy)

fuzzy 关键字 : 用来模糊查询含有指定关键字的文档


#fuzzy 模糊查询  用来模糊查询含有指定关键字的文档
#规则:
# 搜索关键词长度为2 不允许存在模糊
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "北京"
    }
  }
}
# 搜索关键词长度为3~5 允许一次模糊 把mvc写成mvx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content":"mvx"
    }
  }
}
# 搜索关键词长度为5以上  允许最大模糊数2个 将spring写成xprinx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "xprinx"
    }
  }
fuzzy 模糊查询  最大模糊错误 必须在0-2之间
# 搜索关键词长度为 2  不允许存在模糊 0
# 搜索关键词长度为3-5 允许一次模糊   0 1 
# 搜索关键词长度大于5 允许最大2模糊

image.png


10. 布尔查询(bool)

bool 关键字 : 用来组合多个条件实现复杂查询


must: 相当于&& 同时成立


should: 相当于|| 成立一个就行


must_not: 相当于! 不能满足任何一个


#bool 布尔查询 && || !
# bool关键字 用来组合多个条件实现复杂查询
#must 相当于&&同时成立
#should 相当于||成立一个
# must_not :相当于! 不满足任何一个条件
GET /ems/emp/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "content": {
              "value": "框"
            }
          }
        }
      ],"must_not": [
        {"term": {
          "name": {
            "value": "黑"
          }
        }}
      ],
      "should": [
        {
          "ids": {
            "values": ["c_MrnX0BfC_D9Fr1AcjP"]
          }
        }
      ]
    }
  }
}

11. 高亮查询(highlight)

highlight 关键字 : 可以让符合条件的文档中的关键词高亮


GET /ems/emp/_search
{
  "query": {
    "term": {
      "content": {
        "value": "redis"
      }
    }
  },
  "highlight": {
    "fields": {
      "*": {}
    }
  } 
}

自定义高亮html标签 : 可以在highlight中使用pre_tags和post_tags


GET /ems/emp/_search
{
  "query":{
    "term":{
      "content":"框架"
    }
  },
  "highlight": {
    "pre_tags": ["<span style='color:red'>"],
    "post_tags": ["</span>"],
    "fields": {
      "*":{}
    }
  }
}

多字段高亮 使用require_field_match开启多个字段高亮


12. 多字段查询(multi_match)

#查询所有
GET /ems/emp/_search?q=*
#multi_match 多字段查询
GET /ems/emp/_search
{
  "query": {
  "multi_match": {
    "query": "框",
    #这里写要检索的指定字段
    "fields": ["name","content"] 
  }
  }
}

13. 多字段分词查询(query_string)

#query_string 多字段分词查询
GET /ems/emp/_search
{
  "query": {
    "query_string": {
      "query": "框架黑",
      "fields": ["name","content"]
    }
  }
}
相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。 &nbsp;
相关文章
|
8月前
|
弹性计算 运维 算法
阿里云 Elasticsearch Serverless 检索增强型 8.17 版来袭!
阿里云Elasticsearch Serverless 8.17版本,深度融合无服务器架构与分层扩展能力,面向信息检索、向量搜索、语义分析等通用场景,提供全托管服务,在最新特性扩展、自动扩缩性能、资源成本优化等维度均有显著提升。
408 15
|
9月前
|
数据采集 JSON 数据挖掘
Elasticsearch 的DSL查询,聚合查询与多维度数据统计
Elasticsearch的DSL查询与聚合查询提供了强大的数据检索和统计分析能力。通过合理构建DSL查询,用户可以高效地搜索数据,并使用聚合查询对数据进行多维度统计分析。在实际应用中,灵活运用这些工具不仅能提高查询效率,还能为数据分析提供深入洞察。理解并掌握这些技术,将显著提升在大数据场景中的分析和处理能力。
446 20
|
存储 API 数据库
检索服务elasticsearch索引(Index)
【8月更文挑战第23天】
644 6
|
存储 负载均衡 监控
检索服务elasticsearch节点(Node)
【8月更文挑战第23天】
265 5
|
存储 监控 负载均衡
检索服务elasticsearch集群(Cluster)
【8月更文挑战第23天】
170 3
|
存储 监控 负载均衡
检索服务elasticsearch分布式结构
【8月更文挑战第22天】
197 3
|
12月前
|
弹性计算 运维 Serverless
超值选择:阿里云Elasticsearch Serverless在企业数据检索与分析中的高性能与灵活性
本文介绍了阿里云Elasticsearch Serverless服务的高性价比与高度弹性灵活性。
508 8
|
存储 自然语言处理 关系型数据库
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
聚合、补全、RabbitMQ消息同步、集群、脑裂问题、集群分布式存储、黑马旅游实现过滤和搜索补全功能
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
|
JSON 自然语言处理 算法
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
DSL查询文档、RestClient查询文档、全文检索查询、精准查询、复合查询、地理坐标查询、分页、排序、高亮、黑马旅游案例
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
|
SQL 存储 自然语言处理
检索服务elasticsearch全文搜索
【8月更文挑战第22天】
230 3