白话Elasticsearch04- 结构化搜索之使用terms query搜索多个值以及多值搜索结果优化

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 白话Elasticsearch04- 结构化搜索之使用terms query搜索多个值以及多值搜索结果优化

20190512185019228.png20190806092132811.jpg

terms概述


继续跟中华石杉老师学习ES,第三篇

课程地址: https://www.roncoo.com/view/55

https://www.elastic.co/guide/en/elasticsearch/reference/6.4/query-dsl-terms-filter.html

20190512215903923.png

6.4版本对应的 terms query

https://www.elastic.co/guide/en/elasticsearch/reference/6.4/query-dsl-terms-query.html


7.0 版本对应的 terms query

https://www.elastic.co/guide/en/elasticsearch/reference/7.0/query-dsl-terms-query.html

前面的实例中,我们都是使用的term,只能将一个字段,从一个value中取搜索

term: {"field": "value"}


比如

{
   "term": {
      "articcleID": "XHDK-A-1293-#fJ3"
    }
  }


terms 呢? terms可以实现将一个字段,从多个value中检索的效果

terms: {"field": ["value1", "value2"]}


类似于SQL中的in

select * from table where col in ("value1","value2"......)


准备数据

为了演示terms, 我们再新增个tag字段吧

POST /forum/article/_bulk
{"update":{"_id":"1"}}
{"doc":{"tag":["java","hadoop"]}}
{"update":{"_id":"2"}}
{"doc":{"tag":["java"]}}
{"update":{"_id":"3"}}
{"doc":{"tag":["hadoop"]}}
{"update":{"_id":"4"}}
{"doc":{"tag":["java","elasticsearch"]}}


小例子

搜索articleID为KDKE-B-9947-#kL5或QQPX-R-3956-#aD8的帖子

GET /forum/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "terms": {
          "articleID": [
            "KDKE-B-9947-#kL5",
            "QQPX-R-3956-#aD8"
          ]
        }
      }
    }
  }
}


Terms Query写法(推荐)

GET /forum/_search
{
  "query": {
    "terms": {
      "articleID": [
        "KDKE-B-9947-#kL5",
        "QQPX-R-3956-#aD8"
      ]
    }
  }
}


20190512185036437.png



搜索tag中包含java的帖子

GET /forum/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "terms": {
          "tag": [
            "java"
          ]
        }
      }
    }
  }


Terms Query写法(推荐)

GET /forum/_search
{
  "query": {
    "terms": {
      "tag": [
        "java"
      ]
    }
  }
}


20190512185019228.png


优化搜索结果,仅仅搜索tag只包含java的帖子


上面的第二个例子中,搜索java ,可以看到返回了3条结果,其中

  "tag": [
            "java",
            "elasticsearch"
          ]
  "tag": [
            "java",
            "hadoop"
          ],


也被搜索出来了,如果仅仅是想搜索tag只包含java的帖子呢 ?

为了达到该效果,我们新增个tag_cnt字段 ,用数量来过滤下

POST /forum/article/_bulk
{"update":{"_id":"1"}}
{"doc":{"tag_cnt":2}}
{"update":{"_id":"2"}}
{"doc":{"tag_cnt":1}}
{"update":{"_id":"3"}}
{"doc":{"tag_cnt":1}}
{"update":{"_id":"4"}}
{"doc":{"tag_cnt":2}}


GET /forum/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "bool": {
          "must": [
            {
              "term": {
                "tag_cnt": 1
              }
            },
            {
              "terms":{
                "tag":["java"]
              }
            }
          ]
        }
      }
    }
  }
}


20190512185000670.png


Terms Query写法(推荐) ,_score 固定为1

GET /forum/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "tag_cnt": 1
          }
        },
        {
          "terms": {
            "tag": [
              "java"
            ]
          }
        }
      ]
    }
  }
}


计算相关度分数 _score 的写法

GET /forum/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "tag_cnt": 1
          }
        },
        {
          "terms": {
            "tag": [
              "java"
            ]
          }
        }
      ]
    }
  }
}


20190512221359893.png



总结一下:

  • terms多值搜索
  • 优化terms多值搜索的结果,可以增加个cnt字段标示一下,组合过滤
  • terms相当于SQL中的in语句


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
1月前
|
存储 缓存 固态存储
优化Elasticsearch 硬件配置
优化Elasticsearch 硬件配置
78 5
|
1月前
|
缓存 监控 安全
Elasticsearch扩展和优化
【11月更文挑战第4天】
44 6
|
2月前
|
存储 自然语言处理 BI
|
2月前
|
存储 自然语言处理 Java
Elasticsearch写入优化
【10月更文挑战第3天】Elasticsearch:从写入原理谈写入优化
102 2
|
3天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
6天前
|
存储 人工智能 API
(Elasticsearch)使用阿里云 infererence API 及 semantic text 进行向量搜索
本文展示了如何使用阿里云 infererence API 及 semantic text 进行向量搜索。
|
2天前
|
搜索推荐 API 定位技术
一文看懂Elasticsearch的技术架构:高效、精准的搜索神器
Elasticsearch 是一个基于 Lucene 的开源搜索引擎,以其强大的全文本搜索功能和快速的倒排索引技术著称。它不仅支持数字、文本、地理位置等多类型数据,还提供了可调相关度分数、高级查询 DSL 等功能。Elasticsearch 的核心技术流程包括数据导入、解析、索引化、查询处理、得分计算及结果返回,确保高效处理大规模数据并提供准确的搜索结果。通过 RESTful API、Logstash 和 Filebeat 等工具,Elasticsearch 可以从多种数据源中导入和解析数据,支持复杂的查询需求。
13 0
|
1月前
|
存储 缓存 监控
优化Elasticsearch 索引设计
优化Elasticsearch 索引设计
22 5
|
1月前
|
缓存 监控 安全
优化Elasticsearch 集群配置
优化Elasticsearch 集群配置
68 4
|
1月前
|
监控 负载均衡 安全
Elasticsearch集群配置优化
Elasticsearch集群配置优化
32 1
下一篇
DataWorks