ElasticSearch中DSL高级检索(Query)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: ElasticSearch中DSL高级检索(Query)

ElasticSearch中DSL高级检索(Query)

es分布式搜索引擎 作用:搜索 全文检索


ES官方提供了两中检索方式:一种是通过 URL 参数进行搜索,另一种是通过 DSL(Domain Specified Language) 进行搜索``。``官方更推荐使用第二种方式第二种方式是基于传递JSON作为请求体(request body)格式与ES进行交互,这种方式更强大,更简洁``。


1、检索方式 _search

官方提供两种检索方式:


(1)QueryString Query 字符串查询

URL查询 :GET/索引/类型/_search?数据 【传统url】


image.png


(2)QueryDSL 特定领域语言查询

** DQL查询(request body):** GET /索引/类型/_search {json} 【resultful url】


image.png



QueryString 字符串查询 传统参数?拼接【传统URL】
   查询所有(默认10条):Get /索引名/类型名/_search?q=*  
   查询索引(自定义条数):Get /索引名/类型名/_search?q=*&size=20&from=0
QueryDSL: 特定领域语言查询 传递数据 请求体中使用json的形式传递
requestBody的形式
Get /索引名/类型名/_search
{
"query":{"match_all":{}}//查询所有
 "size":20  //指定展示的条数
 "from":0  //从第几条开始展示1--0 2---1
 "sort":[
 {
    "age":{
        "order":"asc升|desc"
    }
 }
 ]
}

二、DSL高级检索(Query)

0. 查询所有(match_all)

match_all关键字: 返回索引中的全部文档


GET /ems/emp/_search
{
   "query": { "match_all": {} }
}  

1. 查询结果中返回指定条数(size)

size 关键字 : 指定查询结果中返回指定条数。 默认返回值10条


GET /ems/emp/_search
{
   "query": { "match_all": {} },
  "size": 1
}  

2. 分页查询(from)

from 关键字 : 用来指定起始返回位置,和size关键字连用可实现分页效果


GET /ems/emp/_search
{
      "query": {"match_all": {}},
      "sort": [
        {
          "age": {
            "order": "desc"
          }
        }
      ],
      "size": 2, 
      "from": 1
}

3. 查询结果中返回指定字段(_source)

_source 关键字 : 是一个数组,在数组中用来指定展示那些字段


GET /ems/emp/_search
{
      "query": { "match_all": {} },
      "_source": ["account_number", "balance"]
}

4. 关键词查询(term)

term 关键字 : 用来使用关键词查询


GET /ems/emp/_search
{
  "query": {
    "term": {
      "address": {
        "value": "北京"
      }
    }
  }
}
#1、只对text类型的数据进行分词
    integer.keyWard lang double boolean ip 类型都不参与分词
#2、标准分词器分词时对中文单字分词 对英文单词分词    

NOTE1: 通过使用term查询知ES中默认使用分词器为标准分词器(StandardAnalyzer),标准分词器对于英文单词分词,对于中文单字分词 。


NOTE2: 通过使用term查询得知,在ES的Mapping Type 中 keyword , date ,integer, long , double , boolean or ip 这些类型不分词 ,只有text类型分词 。

image.png



关键字查询底层实现原理

image.png


5. 范围查询(range)

range 关键字 : 用来指定查询指定范围内的文档


#range 范围查询 根据年龄搜索 0-10 等价于关系型数据库的betweend--and
# gte:大于等于  gt:大于 lt:小于 lte:小于等于
GET /ems/emp/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 0,
        "lte": 10
      }
    }
  }
}

6. 前缀查询(prefix)

prefix 关键字 : 用来检索含有指定前缀的关键词的相关文档



# 前缀查询(prewfix) like "x%"
GET /ems/emp/_search
{
  "query": {
    "prefix": {
      "address": {
        "value": "北"
      }
    }
  }
}

7. 通配符查询(wildcard)

wildcard 关键字 : 通配符查询 ? 用来匹配一个任意字符 * 用来匹配多个任意字符


#通配符查询(wildcard)
# ?匹配一个字符 *可以匹配多个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "re*"
      }
    }
  }
}
# ?匹配一个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "sprin?"
      }
    }
  }
}

8. 多id查询(ids)

ids 关键字 : 值为数组类型,用来根据一组id获取多个对应的文档


#多id查询
GET /ems/emp/_search
{
  "query": {
    "ids": {
      "values": ["dPMrnX0BfC_D9Fr1AcjP","c_MrnX0BfC_D9Fr1AcjP"]
    }
  }
}

9. 模糊查询(fuzzy)

fuzzy 关键字 : 用来模糊查询含有指定关键字的文档


#fuzzy 模糊查询  用来模糊查询含有指定关键字的文档
#规则:
# 搜索关键词长度为2 不允许存在模糊
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "北京"
    }
  }
}
# 搜索关键词长度为3~5 允许一次模糊 把mvc写成mvx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content":"mvx"
    }
  }
}
# 搜索关键词长度为5以上  允许最大模糊数2个 将spring写成xprinx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "xprinx"
    }
  }
fuzzy 模糊查询  最大模糊错误 必须在0-2之间
# 搜索关键词长度为 2  不允许存在模糊 0
# 搜索关键词长度为3-5 允许一次模糊   0 1 
# 搜索关键词长度大于5 允许最大2模糊

image.png


10. 布尔查询(bool)

bool 关键字 : 用来组合多个条件实现复杂查询


must: 相当于&& 同时成立


should: 相当于|| 成立一个就行


must_not: 相当于! 不能满足任何一个


#bool 布尔查询 && || !
# bool关键字 用来组合多个条件实现复杂查询
#must 相当于&&同时成立
#should 相当于||成立一个
# must_not :相当于! 不满足任何一个条件
GET /ems/emp/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "content": {
              "value": "框"
            }
          }
        }
      ],"must_not": [
        {"term": {
          "name": {
            "value": "黑"
          }
        }}
      ],
      "should": [
        {
          "ids": {
            "values": ["c_MrnX0BfC_D9Fr1AcjP"]
          }
        }
      ]
    }
  }
}

11. 高亮查询(highlight)

highlight 关键字 : 可以让符合条件的文档中的关键词高亮


GET /ems/emp/_search
{
  "query": {
    "term": {
      "content": {
        "value": "redis"
      }
    }
  },
  "highlight": {
    "fields": {
      "*": {}
    }
  } 
}

自定义高亮html标签 : 可以在highlight中使用pre_tags和post_tags


GET /ems/emp/_search
{
  "query":{
    "term":{
      "content":"框架"
    }
  },
  "highlight": {
    "pre_tags": ["<span style='color:red'>"],
    "post_tags": ["</span>"],
    "fields": {
      "*":{}
    }
  }
}

多字段高亮 使用require_field_match开启多个字段高亮


12. 多字段查询(multi_match)

#查询所有
GET /ems/emp/_search?q=*
#multi_match 多字段查询
GET /ems/emp/_search
{
  "query": {
  "multi_match": {
    "query": "框",
    #这里写要检索的指定字段
    "fields": ["name","content"] 
  }
  }
}

13. 多字段分词查询(query_string)

#query_string 多字段分词查询
GET /ems/emp/_search
{
  "query": {
    "query_string": {
      "query": "框架黑",
      "fields": ["name","content"]
    }
  }
}
相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
Docker 索引 容器
Elasticsearch跨集群检索配置
Elasticsearch跨集群检索配置
66 1
|
4天前
|
存储 缓存 负载均衡
elasticsearch写入流程和请求检索流程原理全方位解析
elasticsearch写入流程和请求检索流程原理全方位解析
|
2月前
|
人工智能 自然语言处理 开发者
Langchain 与 Elasticsearch:创新数据检索的融合实战
Langchain 与 Elasticsearch:创新数据检索的融合实战
59 10
|
2月前
|
存储 机器学习/深度学习 搜索推荐
Elasticsearch 8.X 向量检索和普通检索能否实现组合检索?如何实现?
Elasticsearch 8.X 向量检索和普通检索能否实现组合检索?如何实现?
44 3
|
2月前
|
存储 Java 索引
Elasticsearch 8.X:这个复杂的检索需求如何实现?
Elasticsearch 8.X:这个复杂的检索需求如何实现?
32 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
干货 | 详述 Elasticsearch 向量检索发展史
干货 | 详述 Elasticsearch 向量检索发展史
88 0
|
2月前
|
搜索推荐 算法 数据挖掘
探索 Elasticsearch 8.X Terms Set 检索的应用与原理
探索 Elasticsearch 8.X Terms Set 检索的应用与原理
33 0
|
2月前
|
数据采集 自然语言处理 API
Elasticsearch 8.X 路径检索的企业级玩法
Elasticsearch 8.X 路径检索的企业级玩法
18 0
|
2月前
|
存储 缓存 运维
Elasticsearch 8.X 检索实战调优锦囊 001
Elasticsearch 8.X 检索实战调优锦囊 001
25 0
|
2月前
|
存储 机器学习/深度学习 关系型数据库
为什么Elasticsearch/Lucene检索可以比MySQL快?
为什么Elasticsearch/Lucene检索可以比MySQL快?
56 2