白话Elasticsearch42-深入聚合数据分析之案例实战__bucket filter:统计牌品最近一个月的平均价格(Filter Aggregation)

简介: 白话Elasticsearch42-深入聚合数据分析之案例实战__bucket filter:统计牌品最近一个月的平均价格(Filter Aggregation)

20190806092132811.jpg


概述

继续跟中华石杉老师学习ES,第41篇

课程地址https://www.roncoo.com/view/55


官方说明

Filter Aggregation:戳这里


20190824121434599.png


案例


需求: 统计牌品最近一个月的平均价格

今天是 2019-08-24 ,为了演示该案例,我们批量更新下数据

POST /tvs/sales/_bulk
{"update":{"_id":"3n0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-07-30"}}
{"update":{"_id":"4H0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-01-05"}}
{"update":{"_id":"4n0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-04-12"}}
{"update":{"_id":"230msmwBYSg4rD-7WPaa"}}
{"doc":{"sold_date":"2019-03-28"}}
{"update":{"_id":"3X0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-05-20"}}
{"update":{"_id":"3H0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-06-05"}}
{"update":{"_id":"330msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-08-02"}}
{"update":{"_id":"4X0msmwBYSg4rD-7WPab"}}
{"doc":{"sold_date":"2019-07-30"}}


更新后的数据:

20190824123243886.png


DSL:

#统计牌品最近一个月的平均价格
GET /tvs/sales/_search 
{
  "query": {
    "term": {
      "brand": "TCL"
    }
  },
  "aggs": {
    "recent_30d": {
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-30d"
          }
        }
      },
      "aggs": {
        "recent_30d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }, 
  "size": 0
}


返回


2019082412345959.png


分析一下:


aggs.filter,针对的是聚合。


为什么不把filter放在query里呢? 如果放query里面的filter,是全局的,会对所有的数据都有影响 。


但是假设你要统计TCL电视,最近1个月的平均值; 最近3个月的平均值; 最近6个月的平均值


那就需要对bucket 进行 filter:对不同的bucket下的aggs,进行filter

#统计牌品最近一个月的平均价格
GET /tvs/sales/_search 
{
  "query": {
    "term": {
      "brand": "TCL"
    }
  },
  "aggs": {
    "recent_30d": {
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-30d"
          }
        }
      },
      "aggs": {
        "recent_30d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    },
    "recent_90d":{
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-90d"
          }
        }
      },
      "aggs": {
        "recent_90d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    },
    "recent_180d":{
      "filter": {
        "range": {
          "sold_date": {
            "gte": "now-180d"
          }
        }
      },
      "aggs": {
        "recent_180d_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }
}

返回:

{
  "took": 12,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 0.9808292,
    "hits": [
      {
        "_index": "tvs",
        "_type": "sales",
        "_id": "330msmwBYSg4rD-7WPab",
        "_score": 0.9808292,
        "_source": {
          "price": 1200,
          "color": "绿色",
          "brand": "TCL",
          "sold_date": "2019-08-02"
        }
      },
      {
        "_index": "tvs",
        "_type": "sales",
        "_id": "3n0msmwBYSg4rD-7WPab",
        "_score": 0.6931472,
        "_source": {
          "price": 1500,
          "color": "蓝色",
          "brand": "TCL",
          "sold_date": "2019-07-30"
        }
      }
    ]
  },
  "aggregations": {
    "recent_30d": {
      "doc_count": 2,
      "recent_30d_price": {
        "value": 1350
      }
    },
    "recent_90d": {
      "doc_count": 2,
      "recent_90d_price": {
        "value": 1350
      }
    },
    "recent_180d": {
      "doc_count": 2,
      "recent_180d_price": {
        "value": 1350
      }
    }
  }
}


相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
4月前
|
缓存 监控 前端开发
顺企网 API 开发实战:搜索 / 详情接口从 0 到 1 落地(附 Elasticsearch 优化 + 错误速查)
企业API开发常陷参数、缓存、错误处理三大坑?本指南拆解顺企网双接口全流程,涵盖搜索优化、签名验证、限流应对,附可复用代码与错误速查表,助你2小时高效搞定开发,提升响应速度与稳定性。
|
7月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
919 0
|
10月前
|
人工智能 自然语言处理 运维
让搜索引擎“更懂你”:AI × Elasticsearch MCP Server 开源实战
本文介绍基于Model Context Protocol (MCP)标准的Elasticsearch MCP Server,它为AI助手(如Claude、Cursor等)提供与Elasticsearch数据源交互的能力。文章涵盖MCP概念、Elasticsearch MCP Server的功能特性及实际应用场景,例如数据探索、开发辅助。通过自然语言处理,用户无需掌握复杂查询语法即可操作Elasticsearch,显著降低使用门槛并提升效率。项目开源地址:<https://github.com/awesimon/elasticsearch-mcp>,欢迎体验与反馈。
2676 1
|
12月前
|
SQL JSON 数据可视化
基于 DIFY 的自动化数据分析实战
本文介绍如何使用DIFY搭建数据分析自动化流程,实现从输入需求到查询数据库、LLM分析再到可视化输出的全流程。基于经典的employees数据集和DIFY云端环境,通过LLM-SQL解析、SQL执行、LLM数据分析及ECharts可视化等模块,高效完成数据分析任务。此方案适用于人力资源分析、薪酬管理等数据密集型业务,显著提升效率并降低成本。
15168 16
|
12月前
|
存储 分布式计算 大数据
基于阿里云大数据平台的实时数据湖构建与数据分析实战
在大数据时代,数据湖作为集中存储和处理海量数据的架构,成为企业数据管理的核心。阿里云提供包括MaxCompute、DataWorks、E-MapReduce等在内的完整大数据平台,支持从数据采集、存储、处理到分析的全流程。本文通过电商平台案例,展示如何基于阿里云构建实时数据湖,实现数据价值挖掘。平台优势包括全托管服务、高扩展性、丰富的生态集成和强大的数据分析工具。
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
954 4
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
306 2
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
434 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
1426 4
数据分析的 10 个最佳 Python 库
|
机器学习/深度学习 数据采集 数据可视化
数据分析之旅:用Python探索世界
数据分析之旅:用Python探索世界
175 3