Dremio简述

简介: 一.简述 Dremio是一款DaaS(Data-as-a-Service)数据即服务平台,可对接多类数据源来进行BI分析;数据可视化依托于Tableau、Power BI和Qlick sense三类产品。

一.简述

Dremio是一款DaaS(Data-as-a-Service)数据即服务平台,可对接多类数据源来进行BI分析;数据可视化依托于Tableau、Power BI和Qlik sense三类产品。

二.功能

a).Dremio支持的数据源

b).Dremio支持数据类型

c).执行任务分析

可分析SQL执行的各环节耗时等,对SQL优化很有帮助

三.下载安装

a).Dremio下载

根据实际应用系统,选择对应版本下载Dremio

dremio-community-3.3.1.tar.gz
dremio-community-3.3.1.noarch.rpm

b).Dremio驱动下载

1).JDBC

Download: dremio-jdbc-driver-3.3.1

2).ODBC

Download For Win: dremio-connector-odbc-1.4.0
Download For Linux: dremio-odbc-1.4.0

c).可视化工具下载

1).Qlik Sense

Qlik_Sense_Desktop免费试用版

2).Tableau

TableauDesktop免费试用版
TableauPublicDesktop免费版

3).Power BI

PBIDesktop免费试用版

d).安装

1).dremio-connector-odbc安装

2).Tableau安装

3).Dremio安装

rpm -ivh dremio-community-3.3.1-201907291852280797_df23756_1.noarch.rpm

tar -zxvf dremio-community-3.3.1-201907291852280797-df23756.tar.gz

4).修改配置

paths: {
  # the local path for dremio to store data.
  local: ${DREMIO_HOME}"/data"

  # the distributed path Dremio data including job results, downloads, uploads, etc
  #dist: "pdfs://"${paths.local}"/pdfs"
}

services: {
  coordinator.enabled: true,
  coordinator.master.enabled: true,
  executor.enabled: true
}

registration.publish-host: "hostname"

## Use External Zookeeper
services.coordinator.master.embedded-zookeeper.enabled: false
zookeeper: "hostname1:2181,hostname2:2181,hostname3:2181"

四.案例

a).hive数据分析

Dremio案例_Hive数据分析

b).hdfs数据分析

Dremio案例_HDFS文件数据分析

c).本地Json文件数据分析

Dremio案例_本地Json文件数据分析

d).Elasticserch数据分析

Dremio案例_Elasticserch数据分析

目录
相关文章
|
SQL 存储 数据挖掘
Dremio架构分析
一.Dremio架构 Dremio是基于Apache calcite、Apache arrow和Apache parquet3个开源框架构建,结构其核心引擎Sabot,形成这款DaaS(Data-as-a-Service)数据即服务平台;整体体验风格与其公司开源的Apache Drill非常接近。
10581 0
|
存储 SQL 机器学习/深度学习
Dremio:使数据分析民主化
Dremio:使数据分析民主化
Dremio:使数据分析民主化
|
SQL 数据挖掘 HIVE
Dremio案例_Hive数据分析
说明 Dremio-3.3.1支持Hive-2.1.1版本 1.Hive批量导入数据 a).创建表 ## 创建文本数据导入表 CREATE TABLE IF NOT EXISTS database.table_name( agent_id int, accept_time string, ...
3983 0
|
数据挖掘 数据格式 JSON
Dremio案例_Elasticserch数据分析
说明 Dremio-3.3.1支持Elasticserch-5.x和6.x;本次使用Elasticserch-6.1.2 1.Elasticserch批量导入数据 ## 导入数据 crul -H 'Content-Type: application/json' -XPOST hostname:92...
3351 0
|
10月前
|
存储 消息中间件 人工智能
Fluss:重新定义实时数据分析与 AI 时代的流式存储
Apache Fluss(孵化中)是新一代流式存储系统,旨在解决传统架构中数据重复复制、高成本与复杂性等问题。它基于 Apache Arrow 构建,支持列式存储、实时更新与高效查询,融合流处理与湖仓架构优势,适用于实时分析、AI 与多模态数据场景。Fluss 提供统一读写、冷热分层与开放生态,已在阿里巴巴大规模落地,助力企业实现低成本、高效率的实时数据处理。
837 26
|
数据采集 人工智能 数据管理
数据管理进化论:DMS助力企业实现智能Data Mesh
Gartner分析师认为Data Mesh对企业提升数据价值交付效率具有重要意义,阿里云数据管理服务DMS给出了对于Data Mesh的核心思考,包括企业什么时候应该考虑实施Data Mesh,如何解决业务团队素养和意愿问题。结合这些思考,DMS提出了企业可行的落地策略,即企业应以数据价值不断提升为导向,基于元数据驱动的Fabric、AI等能力实现智能Data Mesh,最终形成分布式和集中化的动态平衡,以达到企业数据驱动的最佳状态。
2316 6
数据管理进化论:DMS助力企业实现智能Data Mesh
|
存储 SQL 分布式计算
|
存储 Kubernetes 网络协议
Kubernetes 集群部署 NFS-Subdir-External-Provisioner 存储插件
Kubernetes 对 Pod 进行调度时,以当时集群中各节点的可用资源作为主要依据,自动选择某一个可用的节点,并将 Pod 分配到该节点上。在这种情况下,Pod 中容器数据的持久化如果存储在所在节点的磁盘上,就会产生不可预知的问题,例如,当 Pod 出现故障,Kubernetes 重新调度之后,Pod 所在的新节点上,并不存在上一次 Pod 运行时所在节点上的数
9558 3
Kubernetes 集群部署 NFS-Subdir-External-Provisioner 存储插件
|
5月前
|
人工智能 IDE 安全
牛,AI 写代码进入“编排时代”:Vibe Kanban 让多个 Agent 并行干活~~~
小华同学推荐高效AI编程工具Vibe Kanban:支持多Agent并行开发、Git隔离安全运行,可视化Code Review,本地部署不外传代码。集成Claude、Codex等主流模型,配合看板式任务管理,提升开发效率50%以上,10万+开发者已订阅!
1177 1
|
Java 数据安全/隐私保护 开发者
SpringBoot整合TrueLicense生成和验证License证书
TrueLicense生成和验证License证书
5083 1