Dremio简述

简介: 一.简述 Dremio是一款DaaS(Data-as-a-Service)数据即服务平台,可对接多类数据源来进行BI分析;数据可视化依托于Tableau、Power BI和Qlick sense三类产品。

一.简述

Dremio是一款DaaS(Data-as-a-Service)数据即服务平台,可对接多类数据源来进行BI分析;数据可视化依托于Tableau、Power BI和Qlik sense三类产品。

二.功能

a).Dremio支持的数据源

b).Dremio支持数据类型

c).执行任务分析

可分析SQL执行的各环节耗时等,对SQL优化很有帮助

三.下载安装

a).Dremio下载

根据实际应用系统,选择对应版本下载Dremio

dremio-community-3.3.1.tar.gz
dremio-community-3.3.1.noarch.rpm

b).Dremio驱动下载

1).JDBC

Download: dremio-jdbc-driver-3.3.1

2).ODBC

Download For Win: dremio-connector-odbc-1.4.0
Download For Linux: dremio-odbc-1.4.0

c).可视化工具下载

1).Qlik Sense

Qlik_Sense_Desktop免费试用版

2).Tableau

TableauDesktop免费试用版
TableauPublicDesktop免费版

3).Power BI

PBIDesktop免费试用版

d).安装

1).dremio-connector-odbc安装

2).Tableau安装

3).Dremio安装

rpm -ivh dremio-community-3.3.1-201907291852280797_df23756_1.noarch.rpm

tar -zxvf dremio-community-3.3.1-201907291852280797-df23756.tar.gz

4).修改配置

paths: {
  # the local path for dremio to store data.
  local: ${DREMIO_HOME}"/data"

  # the distributed path Dremio data including job results, downloads, uploads, etc
  #dist: "pdfs://"${paths.local}"/pdfs"
}

services: {
  coordinator.enabled: true,
  coordinator.master.enabled: true,
  executor.enabled: true
}

registration.publish-host: "hostname"

## Use External Zookeeper
services.coordinator.master.embedded-zookeeper.enabled: false
zookeeper: "hostname1:2181,hostname2:2181,hostname3:2181"

四.案例

a).hive数据分析

Dremio案例_Hive数据分析

b).hdfs数据分析

Dremio案例_HDFS文件数据分析

c).本地Json文件数据分析

Dremio案例_本地Json文件数据分析

d).Elasticserch数据分析

Dremio案例_Elasticserch数据分析

目录
相关文章
|
SQL 存储 数据挖掘
Dremio架构分析
一.Dremio架构 Dremio是基于Apache calcite、Apache arrow和Apache parquet3个开源框架构建,结构其核心引擎Sabot,形成这款DaaS(Data-as-a-Service)数据即服务平台;整体体验风格与其公司开源的Apache Drill非常接近。
9937 0
|
消息中间件 存储 监控
五分钟快速了解Airflow工作流
简介 Airflow是一个以编程方式创作、调度和监控工作流的平台。 使用 Airflow 将工作流创作为有向无环图(DAG)任务。 Airflow 调度程序按照你指定的依赖项在一组workers上执行您的任务。同时,Airflow拥有丰富的命令行实用程序使得在DAG上进行复杂的诊断变得轻而易举。并且提供了丰富的用户界面使可视化生产中运行的工作流、监控进度和需要排查问题时变得非常容易。 当工作流被定义为代码时,它们变得更易于维护、可版本化、可测试和协作。
|
3月前
|
存储 SQL Cloud Native
热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025
Apache Flink 2.0架构实现重大突破,论文《Disaggregated State Management in Apache Flink® 2.0》被VLDB 2025收录。该研究提出解耦式状态管理架构,通过异步执行框架与全新存储引擎ForSt,实现状态与计算分离,显著提升扩展性、容错能力与资源效率,推动Flink向云原生演进,开启流计算新时代。
618 1
热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025
|
12月前
|
数据采集 存储 人工智能
AI时代数据湖实践
本文分享了如何利用阿里云的存储解决方案构建一个具备高效处理、高时效性的AI数据湖,通过高吞吐训练和高效推理帮助企业快速实现数据价值,以及用户在使用中的最佳实践。
1207 3
|
存储 缓存 测试技术
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
近日,在 ClickHouse 发起的分析型数据库性能测试排行榜 ClickBench(https://benchmark.clickhouse.com/)中,现代化实时数仓 SelectDB 时隔两年后再次登顶,在全部近百款数据库和数十种机型中,性能表现位居总榜第一!
448 1
|
SQL 分布式计算 资源调度
一文解析 ODPS SQL 任务优化方法原理
本文重点尝试从ODPS SQL的逻辑执行计划和Logview中的执行计划出发,分析日常数据研发过程中各种优化方法背后的原理,覆盖了部分调优方法的分析,从知道怎么优化,到为什么这样优化,以及还能怎样优化。
104563 1
|
消息中间件 监控 负载均衡
深度剖析Kafka中Coordinator的奥秘
深度剖析Kafka中Coordinator的奥秘
630 1
|
SQL 分布式计算 Apache
官宣|Apache Paimon 0.6.0 发布公告
官宣|Apache Paimon 0.6.0 发布公告
863 2
|
SQL 存储 机器学习/深度学习
2023 Databricks Data+AI Summit:All in AI
Databricks Data+AI Summit 7月初在旧金山召开,整个发布会看下来,最大的感受就是All in AI和All in One。
1379 3
|
存储 SQL 机器学习/深度学习
Dremio:使数据分析民主化
Dremio:使数据分析民主化
Dremio:使数据分析民主化