Dremio使用数据反射提高查询响应

简介: ## 1.描述 Dremio的数据反射就是用来维护源数据的物理优化,可直观理解为关系数据库中的索引;Data Reflections使用列化,压缩,排序,分区和聚合数据等技术,组织和优化Dremio查询执行引擎的数据;所以的反射数据都存在于Dremio的Reflection Store中,及如下配置.

1.描述

Dremio的数据反射是基于Apache Parquet和Apache Arrow的高性能柱状数据结构,用来维护源数据的物理优化,可直观理解为关系数据库中的索引;Data Reflections使用列化,压缩,排序,分区和聚合数据等技术,组织和优化Dremio查询执行引擎的数据;所以的反射数据都存在于Dremio的Reflection Store中,及如下配置项:

## 可配置本地或HDFS等远程存储

paths: {
  # the local path for dremio to store data.
  local: ${DREMIO_HOME}"/data"

  # the distributed path Dremio data including job results, downloads, uploads, etc
  #dist: "pdfs://"${paths.local}"/pdfs"
}

2.数据反射的类型

a).Raw reflections(原始反射)

原始反射包括Raw数据集中的一个或多个字段,按特定字段排序,分区和分布

b).Aggregation reflections(聚合反射)

聚合反射包括Raw数据集中的一个或多个维度和度量字段,按指定字段排序,分区和分布

c).External reflections(外部反射)

外部反射是一种非托管反射,允许用户利用外部系统中内置的现有数据集和汇总表作为Dremio中的反射

3.创建数据反射

a).选择数据源

b).配置反射

c).反射执行任务

任务概括

任务执行明细

任务资源

4.验证反射

a).反射前聚合查询

任务概括

任务执行明细

b).反射后聚合查询

任务概括

任务执行明细

c).数据反射结果

数据反射可以明细提高聚合查询的响应时间,但同时配置了数据反射会增加反射数据的磁盘占用;这也是一种以空间换时间的业务理念。

目录
相关文章
|
存储 SQL 机器学习/深度学习
Dremio:使数据分析民主化
Dremio:使数据分析民主化
Dremio:使数据分析民主化
|
NoSQL MongoDB 关系型数据库
13个Mongodb GUI可视化管理工具,总有一款适合你
本文介绍了13个好用的MongoDB可视化工具。Robomongo,MongoDB Compass,phpMoAdmin等
116232 0
13个Mongodb GUI可视化管理工具,总有一款适合你
|
数据采集 大数据 Java
数据清洗工具OpenRefine
版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 https://blog.csdn.net/chszs/article/details/20046083 数据清洗工具OpenRefine 作者:chszs,转载需注明。
1430 0
|
API 开发工具
淘宝联盟API使用教程
淘宝联盟API使用教程
|
SQL 存储 数据挖掘
Dremio架构分析
一.Dremio架构 Dremio是基于Apache calcite、Apache arrow和Apache parquet3个开源框架构建,结构其核心引擎Sabot,形成这款DaaS(Data-as-a-Service)数据即服务平台;整体体验风格与其公司开源的Apache Drill非常接近。
10451 0
|
网络协议 安全 Android开发
软件丨李跳跳们现在该如何跳呢?
前段时间,李跳跳等软件被某大厂发了律师函,之后,好些个跳广告软件都相继发布公众号说明,停止维护软件,并且下架了相关软件,那我们还能跳吗?该怎么跳呢?
2062 0
软件丨李跳跳们现在该如何跳呢?
|
安全 网络安全 数据安全/隐私保护
Wi-Fi 保护访问(WPA)详解
【4月更文挑战第22天】
1006 0
Wi-Fi 保护访问(WPA)详解
|
Java
【工具类】java数字金额转换成大写
【工具类】java数字金额转换成大写
1042 0

热门文章

最新文章