基于ES之业务数据分类聚合开发

简介: 笔记

先在novel索引上对【category】字段分类聚合,通过在kibana上的测试,出现了一些问题,此问题的原因是类型不是keyword,对需要聚合类的需要设置Type为keyword。因为keyword类型在聚合的时候是作为一个整体的,而text类型会把字分开3.png

对以上问题的实时方案:

我们重新创建一个名为【 novel_category_count 】索引,并对其mapping 的category字段类型修改为keyword。

原novel的mapping:

4.png重新创建一个mapping

将category字段类型修改为keyword:

5.png

加载数据:

# 加载数据
POST _reindex
{
  "source": {
    "index": "novel"
  },
  "dest": {
    "index": "novel_category_count"
  }
}

测试:

GET novel_category_count/_search
{
  "size": 0,
  "aggs": {
    "category_count": {
      "terms": {
        "field": "category"
      }
    }
  }
}

6.png


相关文章
|
2月前
|
数据挖掘 数据建模 BI
Dataphin常见问题之衍生指标的计算逻辑需要写where和group条件如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
数据可视化 大数据 定位技术
I+关系网络分析发布,提供完整的可视化分析和关系引擎功能
I+关系网络分析是以OLP模型为核心,面向业务快速建模,为开发者和终端用户提供大数据关系计算引擎(含API服务)和可视化交互分析能力,面向安防、关税、银行、保险、互联网等提供的产品化方案。目前,I+关系网络分析已在阿里巴巴、蚂蚁金服集团内广泛应用于反欺诈、反作弊、反洗钱等风控业务。
4407 0
|
4月前
|
前端开发
【简历优化平台-02】缺失信息和不规范信息的过滤层
【简历优化平台-02】缺失信息和不规范信息的过滤层
|
存储 SQL 机器学习/深度学习
数仓中指标-标签,维度-度量,自然键-代理键,数据集市等各名词解析及关系
这是在数据分析中常见的概念,下钻可以理解成增加维的层次,从而可以由粗粒度到细粒度来观察数据,比如对产品销售情况分析时,可以沿着时间维从年到月到日更细粒度的观察数据。从年的维度可以下钻到月的维度、日的维度等。
数仓中指标-标签,维度-度量,自然键-代理键,数据集市等各名词解析及关系
|
大数据 开发者
聚合操作_多维聚合_编写代码 | 学习笔记
快速学习聚合操作_多维聚合_编写代码
87 0
聚合操作_多维聚合_编写代码 | 学习笔记
|
监控 架构师 小程序
网站流量日志分析—数仓设计--维度建模三种模式|学习笔记
快速学习网站流量日志分析—数仓设计--维度建模三种模式
274 0
网站流量日志分析—数仓设计--维度建模三种模式|学习笔记
|
存储 SQL
ES聚合查询详解(三):指标聚合
ES聚合查询详解(三):指标聚合
281 0
ES聚合查询详解(三):指标聚合
|
移动开发 搜索推荐 Java
SolrQuery挖掘--单维度聚合分析
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。
161 0
|
存储 SQL 机器学习/深度学习
数仓中指标-标签,维度-度量,自然键-代理键等各名词解析及关系
作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。
695 0
数仓中指标-标签,维度-度量,自然键-代理键等各名词解析及关系

热门文章

最新文章