ElasticSearch中DSL高级检索(Query)

2023-02-10 214

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

简介： ElasticSearch中DSL高级检索(Query)es分布式搜索引擎作用：搜索全文检索ES官方提供了两中检索方式:一种是通过 URL 参数进行搜索,另一种是通过 DSL(Domain Specified Language) 进行搜索``。``官方更推荐使用第二种方式第二种方式是基于传递JSON作为请求体(request body)格式与ES进行交互，这种方式更强大，更简洁``。

1、检索方式 _search

官方提供两种检索方式：

（1）QueryString Query 字符串查询

URL查询：GET/索引/类型/_search?数据【传统url】

（2）QueryDSL 特定领域语言查询

** DQL查询（request body）：** GET /索引/类型/_search {json} 【resultful url】

QueryString 字符串查询 传统参数？拼接【传统URL】
   查询所有(默认10条)：Get /索引名/类型名/_search?q=*  
   查询索引(自定义条数)：Get /索引名/类型名/_search?q=*&size=20&from=0

QueryDSL： 特定领域语言查询 传递数据 请求体中使用json的形式传递
requestBody的形式
Get /索引名/类型名/_search
{
"query":{"match_all":{}}//查询所有
 "size":20  //指定展示的条数
 "from":0  //从第几条开始展示1--0 2---1
 "sort":[
 {
    "age":{
        "order":"asc升|desc"
    }
 }
 ]
}

二、DSL高级检索(Query)

0. 查询所有(match_all)

match_all关键字: 返回索引中的全部文档

GET /ems/emp/_search
{
   "query": { "match_all": {} }
}

1. 查询结果中返回指定条数(size)
size 关键字 : 指定查询结果中返回指定条数。 默认返回值10条

GET /ems/emp/_search
{
   "query": { "match_all": {} },
  "size": 1
}

2. 分页查询(from)

from 关键字 : 用来指定起始返回位置，和size关键字连用可实现分页效果

GET /ems/emp/_search
{
      "query": {"match_all": {}},
      "sort": [
        {
          "age": {
            "order": "desc"
          }
        }
      ],
      "size": 2, 
      "from": 1
}

3. 查询结果中返回指定字段(_source)

_source 关键字 : 是一个数组,在数组中用来指定展示那些字段

GET /ems/emp/_search
{
      "query": { "match_all": {} },
      "_source": ["account_number", "balance"]
}

4. 关键词查询(term)

term 关键字 : 用来使用关键词查询

GET /ems/emp/_search
{
  "query": {
    "term": {
      "address": {
        "value": "北京"
      }
    }
  }
}
#1、只对text类型的数据进行分词
    integer.keyWard lang double boolean ip 类型都不参与分词
#2、标准分词器分词时对中文单字分词 对英文单词分词

NOTE1: 通过使用term查询知ES中默认使用分词器为标准分词器(StandardAnalyzer),标准分词器对于英文单词分词,对于中文单字分词。

NOTE2: 通过使用term查询得知,在ES的Mapping Type 中 keyword , date ,integer, long , double , boolean or ip 这些类型不分词，只有text类型分词。

关键字查询底层实现原理

5. 范围查询(range)

range 关键字 : 用来指定查询指定范围内的文档

#range 范围查询 根据年龄搜索 0-10 等价于关系型数据库的betweend--and
# gte:大于等于  gt:大于 lt:小于 lte:小于等于
GET /ems/emp/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 0,
        "lte": 10
      }
    }
  }
}

6. 前缀查询(prefix)

prefix 关键字 : 用来检索含有指定前缀的关键词的相关文档

# 前缀查询（prewfix） like "x%"
GET /ems/emp/_search
{
  "query": {
    "prefix": {
      "address": {
        "value": "北"
      }
    }
  }
}

7. 通配符查询(wildcard)

wildcard 关键字 : 通配符查询 ? 用来匹配一个任意字符 * 用来匹配多个任意字符

#通配符查询（wildcard）
# ?匹配一个字符 *可以匹配多个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "re*"
      }
    }
  }
}
# ？匹配一个字符
GET /ems/emp/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "sprin?"
      }
    }
  }
}

8. 多id查询(ids)

ids 关键字 : 值为数组类型,用来根据一组id获取多个对应的文档

#多id查询
GET /ems/emp/_search
{
  "query": {
    "ids": {
      "values": ["dPMrnX0BfC_D9Fr1AcjP","c_MrnX0BfC_D9Fr1AcjP"]
    }
  }
}

9. 模糊查询(fuzzy)

fuzzy 关键字 : 用来模糊查询含有指定关键字的文档

#fuzzy 模糊查询  用来模糊查询含有指定关键字的文档
#规则：
# 搜索关键词长度为2 不允许存在模糊
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "北京"
    }
  }
}
# 搜索关键词长度为3~5 允许一次模糊 把mvc写成mvx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content":"mvx"
    }
  }
}
# 搜索关键词长度为5以上  允许最大模糊数2个 将spring写成xprinx
GET /ems/emp/_search
{
  "query": {
    "fuzzy": {
      "content": "xprinx"
    }
  }
fuzzy 模糊查询  最大模糊错误 必须在0-2之间
# 搜索关键词长度为 2  不允许存在模糊 0
# 搜索关键词长度为3-5 允许一次模糊   0 1 
# 搜索关键词长度大于5 允许最大2模糊

0. 布尔查询(bool)

bool 关键字 : 用来组合多个条件实现复杂查询

must: 相当于&& 同时成立

should: 相当于|| 成立一个就行

must_not: 相当于! 不能满足任何一个

#bool 布尔查询 && || !
# bool关键字 用来组合多个条件实现复杂查询
#must 相当于&&同时成立
#should 相当于||成立一个
# must_not :相当于！ 不满足任何一个条件
GET /ems/emp/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "content": {
              "value": "框"
            }
          }
        }
      ],"must_not": [
        {"term": {
          "name": {
            "value": "黑"
          }
        }}
      ],
      "should": [
        {
          "ids": {
            "values": ["c_MrnX0BfC_D9Fr1AcjP"]
          }
        }
      ]
    }
  }
}

11. 高亮查询(highlight)

highlight 关键字 : 可以让符合条件的文档中的关键词高亮

GET /ems/emp/_search
{
  "query": {
    "term": {
      "content": {
        "value": "redis"
      }
    }
  },
  "highlight": {
    "fields": {
      "*": {}
    }
  } 
}

自定义高亮html标签 : 可以在highlight中使用pre_tags和post_tags

GET /ems/emp/_search
{
  "query":{
    "term":{
      "content":"框架"
    }
  },
  "highlight": {
    "pre_tags": ["<span style='color:red'>"],
    "post_tags": ["</span>"],
    "fields": {
      "*":{}
    }
  }
}

多字段高亮使用require_field_match开启多个字段高亮

12. 多字段查询(multi_match)

#查询所有
GET /ems/emp/_search?q=*
#multi_match 多字段查询
GET /ems/emp/_search
{
  "query": {
  "multi_match": {
    "query": "框",
    #这里写要检索的指定字段
    "fields": ["name","content"] 
  }
  }
}

13. 多字段分词查询(query_string)

#query_string 多字段分词查询
GET /ems/emp/_search
{
  "query": {
    "query_string": {
      "query": "框架黑",
      "fields": ["name","content"]
    }
  }
}