Superset对接Apache Druid数据源

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 一.简述Apache Superset是一款由Airbnb开源的“现代化的企业级BI(商业智能)的Web应用程序”,其通过创建和分享Dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

一.简述

Apache Superset是一款由Airbnb开源的“现代化的企业级BI(商业智能)的Web应用程序”,其通过创建和分享Dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

Apache Superset的前端主要使用Reat和NVD3/D3,后端则基于Python的Flask框架和Pandas、SQLAichemy等第三方依赖库

二.功能

Ⅰ).集成数据查询

Superset支持多种数据库,包括MySQL、PostgresSQL、Oracle、SQLServer、SQLite、Impala、Hive、ClickHouse等,并深度支持Apache Druid

Ⅱ).细颗粒安全模式

可以在功能层面和数据层面进行访问控制。支持多种鉴权方式(例如数据库、OpenID、LDAP、OAuth、REMOTE_USER等)

Ⅲ).可视化图库

通过NVD3/D3预定义了多种可视化图表库,满足大部分的数据展示功能;另外,也支持嵌入其他的JavaScirpt图标库(例如HighCharts、ECharts),或二次开发

三.权限

Superset的安全行由Flask AppBuilder(FAB)处理。FAB是一个“简单快速的应用程序开发框架,构建在Flask之上”。FAB提供了身份验证、用户管理、权限和角色。默认角色如下:

Ⅰ).Admin

管理员拥有所有的权限,包括授予或撤销其他用户的权限,以及修改其他用户的charts和dashboard

Ⅱ).Alpha

Alpha可以访问所以数据源,但无法授予或撤销其他用户的权限。Alpha用户可以添加和修改数据源

Ⅲ).Gamma

Gamma具有访问权限。Gamma只能使用访问查看Gamma用户自己可访问的数据源制作的charts和dashboard。目前,Gamma用户无法添加和修改数据源

Ⅳ).Sql_lab

被授予对SQL Lab的访问权限

Ⅴ).Public

可通过在superset/config.py设置PUBLIC_ROLE_LIKE_GAMMA=True,授予该角色与Gamma角色相同的权限集

Ⅵ).自定义角色

使用着可以根据自己的需求自定义角色权限

四.依赖

五.使用

Ⅰ).配置Druid数据源

a).选择Sources,下拉菜单选择Druid Clusters

b).点击添加

c).编辑信息

d).刷新数据源


Ⅱ).配置其他数据源

以ClickHouse为例
安装依赖:pip install sqlalchmy_clickhouse

a).点击添加

b).编辑配置

c).测试连接

d).连接成功,展示tables

e).添加成功

六.修改元数据库

默认元数据库是SQLite,实际生产环境中可能需要更可靠的数据库(如MySQL、Oracle)来存储管理元数据,下面以MySQL替换SQLite为例

Ⅰ).安装依赖

pip install mysqlclient

Ⅱ).修改配置

a).路径

./lib/python2.7/site-packages/superset

b).备份

cp config.py config.py_date_time_user.bak

c).编辑

vi config.py
# SQLALCHEMY_DATABASE_URL='sqlite://'+os.path.join(DATA_DIR,'superset.db')

SQLALCHEMY_DATABASE_URL='mysql://db_user:password@db_hostname/superset'

d).初始化

fabmanager create-admin --app superset

e).更新数据库数据

superset db upgrade

f).初始化角色

superset init
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
1月前
|
SQL DataWorks 关系型数据库
阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源,实现 MySQL 整库实时同步
阿里云数据库 SelectDB 版是阿里云与飞轮科技联合基于 Apache Doris 内核打造的现代化数据仓库,支持大规模实时数据上的极速查询分析。通过实时、统一、弹性、开放的核心能力,能够为企业提供高性价比、简单易用、安全稳定、低成本的实时大数据分析支持。SelectDB 具备世界领先的实时分析能力,能够实现秒级的数据实时导入与同步,在宽表、复杂多表关联、高并发点查等不同场景下,提供超越一众国际知名的同类产品的优秀性能,多次登顶 ClickBench 全球数据库分析性能排行榜。
|
2月前
|
存储 分布式计算 druid
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(一)
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(一)
44 1
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(一)
|
2月前
|
存储 分布式计算 druid
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
72 1
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
|
2月前
|
消息中间件 存储 druid
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
49 3
|
2月前
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
69 3
|
2月前
|
消息中间件 分布式计算 druid
大数据-154 Apache Druid 架构与原理详解 基础架构、架构演进
大数据-154 Apache Druid 架构与原理详解 基础架构、架构演进
64 2
|
2月前
|
消息中间件 druid 大数据
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(二)
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(二)
41 2
|
2月前
|
消息中间件 分布式计算 druid
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(二)
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(二)
45 2
|
2月前
|
消息中间件 分布式计算 druid
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(一)
大数据-153 Apache Druid 案例 从 Kafka 中加载数据并分析(一)
61 1
|
2月前
|
存储 消息中间件 druid
大数据-151 Apache Druid 集群模式 配置启动【上篇】 超详细!
大数据-151 Apache Druid 集群模式 配置启动【上篇】 超详细!
92 1

推荐镜像

更多