基于ES之业务数据分类聚合开发

简介: 笔记

先在novel索引上对【category】字段分类聚合,通过在kibana上的测试,出现了一些问题,此问题的原因是类型不是keyword,对需要聚合类的需要设置Type为keyword。因为keyword类型在聚合的时候是作为一个整体的,而text类型会把字分开3.png

对以上问题的实时方案:

我们重新创建一个名为【 novel_category_count 】索引,并对其mapping 的category字段类型修改为keyword。

原novel的mapping:

4.png重新创建一个mapping

将category字段类型修改为keyword:

5.png

加载数据:

# 加载数据
POST _reindex
{
  "source": {
    "index": "novel"
  },
  "dest": {
    "index": "novel_category_count"
  }
}

测试:

GET novel_category_count/_search
{
  "size": 0,
  "aggs": {
    "category_count": {
      "terms": {
        "field": "category"
      }
    }
  }
}

6.png


相关文章
|
6月前
|
数据挖掘 数据建模 BI
Dataphin常见问题之衍生指标的计算逻辑需要写where和group条件如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
数据可视化 大数据 定位技术
I+关系网络分析发布,提供完整的可视化分析和关系引擎功能
I+关系网络分析是以OLP模型为核心,面向业务快速建模,为开发者和终端用户提供大数据关系计算引擎(含API服务)和可视化交互分析能力,面向安防、关税、银行、保险、互联网等提供的产品化方案。目前,I+关系网络分析已在阿里巴巴、蚂蚁金服集团内广泛应用于反欺诈、反作弊、反洗钱等风控业务。
4546 0
|
1月前
|
存储 大数据 分布式数据库
大数据-165 Apache Kylin Cube优化 案例 2 定义衍生维度及对比 & 聚合组 & RowKeys
大数据-165 Apache Kylin Cube优化 案例 2 定义衍生维度及对比 & 聚合组 & RowKeys
35 1
|
3月前
|
SQL 缓存 数据挖掘
数据平台问题之复合指标生成中维度能力如何处理
数据平台问题之复合指标生成中维度能力如何处理
|
6月前
|
数据挖掘 数据库
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
283 0
|
存储 SQL 机器学习/深度学习
数仓中指标-标签,维度-度量,自然键-代理键,数据集市等各名词解析及关系
这是在数据分析中常见的概念,下钻可以理解成增加维的层次,从而可以由粗粒度到细粒度来观察数据,比如对产品销售情况分析时,可以沿着时间维从年到月到日更细粒度的观察数据。从年的维度可以下钻到月的维度、日的维度等。
数仓中指标-标签,维度-度量,自然键-代理键,数据集市等各名词解析及关系
|
大数据 开发者
聚合操作_多维聚合_编写代码 | 学习笔记
快速学习聚合操作_多维聚合_编写代码
116 0
聚合操作_多维聚合_编写代码 | 学习笔记
|
监控 架构师 小程序
网站流量日志分析—数仓设计--维度建模三种模式|学习笔记
快速学习网站流量日志分析—数仓设计--维度建模三种模式
331 0
网站流量日志分析—数仓设计--维度建模三种模式|学习笔记
|
存储 SQL
ES聚合查询详解(三):指标聚合
ES聚合查询详解(三):指标聚合
330 0
ES聚合查询详解(三):指标聚合
下一篇
无影云桌面