白话Elasticsearch42-深入聚合数据分析之案例实战__bucket filter:统计牌品最近一个月的平均价格(Filter Aggregation)

本文涉及的产品
Elasticsearch Serverless检索通用型,资源抵扣包 100CU*H
简介: 白话Elasticsearch42-深入聚合数据分析之案例实战__bucket filter:统计牌品最近一个月的平均价格(Filter Aggregation)

20190806092132811.jpg


概述

继续跟中华石杉老师学习ES,第41篇

课程地址https://www.roncoo.com/view/55


官方说明

Filter Aggregation:戳这里


20190824121434599.png


案例


需求: 统计牌品最近一个月的平均价格

今天是 2019-08-24 ,为了演示该案例,我们批量更新下数据

POST /tvs/sales/_bulk
{"update":{"_id":"3n0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-07-30"}}
{"update":{"_id":"4H0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-01-05"}}
{"update":{"_id":"4n0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-04-12"}}
{"update":{"_id":"230msmwBYSg4rD-7WPaa"}}
{"doc":{"sold_date":"2019-03-28"}}
{"update":{"_id":"3X0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-05-20"}}
{"update":{"_id":"3H0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-06-05"}}
{"update":{"_id":"330msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-08-02"}}
{"update":{"_id":"4X0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-07-30"}}


更新后的数据:

20190824123243886.png


DSL:

#统计牌品最近一个月的平均价格
GET /tvs/sales/_search 
{
  "query": {
    "term": {
      "brand": "TCL"
    }
  },
  "aggs": {
    "recent_30d": {
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-30d"
          }
        }
      },
      "aggs": {
        "recent_30d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }, 
  "size": 0
}


返回


2019082412345959.png


分析一下:


aggs.filter,针对的是聚合。


为什么不把filter放在query里呢? 如果放query里面的filter,是全局的,会对所有的数据都有影响 。


但是假设你要统计TCL电视,最近1个月的平均值; 最近3个月的平均值; 最近6个月的平均值


那就需要对bucket 进行 filter:对不同的bucket下的aggs,进行filter

#统计牌品最近一个月的平均价格
GET /tvs/sales/_search 
{
  "query": {
    "term": {
      "brand": "TCL"
    }
  },
  "aggs": {
    "recent_30d": {
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-30d"
          }
        }
      },
      "aggs": {
        "recent_30d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    },
    "recent_90d":{
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-90d"
          }
        }
      },
      "aggs": {
        "recent_90d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    },
    "recent_180d":{
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-180d"
          }
        }
      },
      "aggs": {
        "recent_180d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }
}

返回:

{
  "took": 12,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 0.9808292,
    "hits": [
      {
        "_index": "tvs",
        "_type": "sales",
        "_id": "330msmwBYSg4rD-7WPab",
        "_score": 0.9808292,
        "_source": {
          "price": 1200,
          "color": "绿色",
          "brand": "TCL",
          "sold_date": "2019-08-02"
        }
      },
      {
        "_index": "tvs",
        "_type": "sales",
        "_id": "3n0msmwBYSg4rD-7WPab",
        "_score": 0.6931472,
        "_source": {
          "price": 1500,
          "color": "蓝色",
          "brand": "TCL",
          "sold_date": "2019-07-30"
        }
      }
    ]
  },
  "aggregations": {
    "recent_30d": {
      "doc_count": 2,
      "recent_30d_price": {
        "value": 1350
      }
    },
    "recent_90d": {
      "doc_count": 2,
      "recent_90d_price": {
        "value": 1350
      }
    },
    "recent_180d": {
      "doc_count": 2,
      "recent_180d_price": {
        "value": 1350
      }
    }
  }
}


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
打赏
0
0
0
0
99
分享
相关文章
让搜索引擎“更懂你”:AI × Elasticsearch MCP Server 开源实战
本文介绍基于Model Context Protocol (MCP)标准的Elasticsearch MCP Server,它为AI助手(如Claude、Cursor等)提供与Elasticsearch数据源交互的能力。文章涵盖MCP概念、Elasticsearch MCP Server的功能特性及实际应用场景,例如数据探索、开发辅助。通过自然语言处理,用户无需掌握复杂查询语法即可操作Elasticsearch,显著降低使用门槛并提升效率。项目开源地址:<https://github.com/awesimon/elasticsearch-mcp>,欢迎体验与反馈。
343 1
超越传统模型:从零开始构建高效的日志分析平台——基于Elasticsearch的实战指南
【10月更文挑战第8天】随着互联网应用和微服务架构的普及,系统产生的日志数据量日益增长。有效地收集、存储、检索和分析这些日志对于监控系统健康状态、快速定位问题以及优化性能至关重要。Elasticsearch 作为一种分布式的搜索和分析引擎,以其强大的全文检索能力和实时数据分析能力成为日志处理的理想选择。
485 6
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
这篇文章是关于如何使用Spring Boot整合Elasticsearch,并通过REST客户端操作Elasticsearch,实现一个简单的搜索前后端,以及如何爬取京东数据到Elasticsearch的案例教程。
420 0
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
数据处理神器Elasticsearch_Pipeline:原理、配置与实战指南
数据处理神器Elasticsearch_Pipeline:原理、配置与实战指南
396 12
Elasticsearch与深度学习框架的集成案例研究
Elasticsearch 是一个强大的搜索引擎和分析引擎,广泛应用于实时数据处理和全文搜索。深度学习框架如 TensorFlow 和 PyTorch 则被用来构建复杂的机器学习模型。本文将探讨如何将 Elasticsearch 与这些深度学习框架集成,以实现高级的数据分析和预测任务。
101 0
Elasticsearch Filter 缓存加速检索的细节,你知道吗?
【8月更文挑战第15天】在大数据与搜索引擎的广阔天地里,Elasticsearch 凭借其强大的全文搜索能力和可扩展性,成为了众多企业和开发者的首选。而在Elasticsearch的性能优化中,Filter缓存(也称为Filter Cache,自Elasticsearch 7.x版本后更名为Query Cache的一部分)扮演着至关重要的角色。今天,我们就来深入探讨一下Elasticsearch Filter缓存如何加速检索过程,以及在日常工作学习中如何有效利用这一特性。
146 0
ElasticSearch 实现分词全文检索 - filter查询
ElasticSearch 实现分词全文检索 - filter查询
88 0
|
19天前
|
Linux安装Elasticsearch详细教程
Linux安装Elasticsearch详细教程
57 1

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等