使用 Docker 探索 Superset BI 数据可视化平台二次开发

简介: 使用 Docker 探索 Superset BI 数据可视化平台二次开发

介绍



Superset 是什么?


Apache Superset 是一个开源的现代的、企业级的商业智能 web 应用程序。是一个数据可视化和数据探索平台。


Apache Superset 被设计成一个标准的云原生(Cloud-Native)应用,与 Kubernetes 结合的非常的好。(Superset 这个系列的后续文章 为少 会和大家详细探讨)


Superset 提供

  • 一个直观的界面,以探索和可视化数据集,并创建交互式仪表板。
  • 大量漂亮的可视化组件来展示您的数据。(其实并不太漂亮😂)
  • 简单,无代码的用户流程,可以对爆露在仪表板下的数据进行细分和切分。仪表板和图表是进行深入分析的起点。
  • 最先进的SQL编辑器/IDE提供了丰富的元数据浏览器,以及从任何结果集创建可视化的简单工作流。
  • 可扩展的高粒度安全模型,允许有关谁可以访问哪些产品功能和数据集的复杂规则。可以与主流的身份验证后端(数据库,OpenID,LDAP,OAuth,REMOTE_USER等)集成。
  • 轻量级语义层,允许通过定义维度和指标来控制如何将数据源公开给用户。
  • 支持对大多数 sql 语言数据库的开箱即用
  • 与 Druid 的深度集成允许 Superset 在切割大型实时数据集时保持极快的速度
  • 具有可配置缓存,可快速加载仪表板


项目和文档


  • 官方 GitHub
  • 官方文档
  • 笔者 Fork 后的项目


从最新的 release 拉一个新的分支


基于 tag 0.37.0 拉出一个新分支 0.37.0-echarts


git branch 0.37.0-echarts 0.37.0
git checkout 0.37.0-echarts


修改 Dockerfile


因为在城内,所以需修改相关 pip 镜像源。加速 Image 的构建。

具体修改如下:


FROM preset/superset:dev
COPY ./requirements* ./docker/requirements* /app/
USER root
RUN cd /app \
    && pip config set global.index-url https://mirrors.cloud.tencent.com/pypi/simple \
    && pip install -e . \
    && pip install --no-cache -r requirements.txt -r requirements-dev.txt \
    && pip install --no-cache -r requirements-extra.txt \
    && pip install --no-cache -r requirements-local.txt || true
USER superset


初始化数据


注意,这里有坑,至少在城内这个坑得填一下。


下载示例数据

从 github 下载:examples-data

启动一个静态服务器


由于为少的电脑是 Mac。它是自带 python 2 的,所以我可以直接:


cd examples-data
python -m SimpleHTTPServer
# Serving HTTP on 0.0.0.0 port 8000 ...


静态服务器,大家本地愿意用啥都行。

修改 examples 里面的 BASE_URL

看一下本机 IP:


ifconfig

微信图片_20220611111413.png

找到相关代码,更改即可。

微信图片_20220611111427.png

执行初始化命令


docker-compose up superset-init


微信图片_20220611111443.png

OK,完美搞定示例数据。


本地开发


启动 Superset 前端开发服务器


docker-compose up superset-node


启动 Superset Flask 服务器


docker-compose up superset


启动 Superset Celery Worker 服务器


docker-compose up superset-worker


微信图片_20220611111505.png

成功之后,我们进入 http://localhost:8088/。

用户名/密码都是 admin


微信图片_20220611111516.png

登录成功后,我们看到可视化面板列表。


微信图片_20220611111530.png

看到没,我们当前的版本是 0.37.0

我们进入 World Bank's Data 面板。


微信图片_20220611111542.png

我们探索下 Growth Rate


微信图片_20220611111554.png

微信图片_20220611111604.png

相关文章
|
7月前
|
关系型数据库 测试技术 数据库
使用Docker搭建测试用例管理平台TestLink:简易指南
使用Docker搭建TestLink测试管理软件的步骤如下:首先,拉取`bitnami/mariadb`和`bitnami/testlink-archived`镜像。然后,启动MariaDB容器,创建数据库。接着,启动TestLink容器并连接到MariaDB。检查容器状态确保它们已启动。最后,访问`localhost:8099`以使用TestLink,默认用户名为`user`,密码为`bitnami`。这样,你就能在本地便捷地进行测试管理了。
|
10天前
|
NoSQL 关系型数据库 MySQL
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
109 56
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
|
2月前
|
SQL 缓存 分布式计算
阿里云连续五年入选Gartner®分析和商业智能平台魔力象限,中国唯一
Gartner® 正式发布《分析与商业智能平台魔力象限》报告(Magic Quadrant™ for Analytics and Business Intelligence Platforms),阿里云成为唯一入围该报告的中国厂商,被评为“挑战者”(Challengers)。这也是阿里云连续五年入选该报告。
|
25天前
|
开发框架 安全 开发者
Docker 是一种容器化技术,支持开发者将应用及其依赖打包成容器,在不同平台运行而无需修改。
Docker 是一种容器化技术,支持开发者将应用及其依赖打包成容器,在不同平台运行而无需修改。本文探讨了 Docker 在多平台应用构建与部署中的作用,包括环境一致性、依赖管理、快速构建等优势,以及部署流程和注意事项,展示了 Docker 如何简化开发与部署过程,提高效率和可移植性。
54 4
|
1月前
|
监控 前端开发 Java
【技术开发】接口管理平台要用什么技术栈?推荐:Java+Vue3+Docker+MySQL
该文档介绍了基于Java后端和Vue3前端构建的管理系统的技术栈及功能模块,涵盖管理后台的访问、登录、首页概览、API接口管理、接口权限设置、接口监控、计费管理、账号管理、应用管理、数据库配置、站点配置及管理员个人设置等内容,并提供了访问地址及操作指南。
|
1月前
|
SQL 监控 数据可视化
数据可视化:Power BI在商业智能中的强大作用
【10月更文挑战第28天】在信息爆炸的时代,数据成为企业决策的重要依据。Power BI作为微软开发的强大数据可视化工具,集数据整合、报表制作和数据可视化于一体,通过简单拖放操作即可生成交互式图表和报表,提高决策效率,实现数据整合与实时监控,助力企业挖掘数据价值,提升竞争力。
76 3
|
2月前
|
机器学习/深度学习 存储 SQL
AllData数据中台核心菜单八:BI平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
7月前
|
开发框架 安全 网络安全
【Docker 专栏】Docker 多平台应用构建与部署
【5月更文挑战第8天】Docker作为一种关键的容器化技术,简化了多平台应用的构建与部署。它提供一致的运行环境,确保应用在不同平台无缝运行;通过分层构建机制加速镜像创建,提升开发效率。Docker的可移植性、高效部署及资源利用率是其主要优势。流程包括开发环境准备、构建镜像、测试验证及部署。然而,面临操作系统差异、网络安全和资源限制等挑战,需注意安全、版本管理和性能优化。Docker在多平台场景的应用将持续发挥价值。
147 6
【Docker 专栏】Docker 多平台应用构建与部署
|
7月前
|
监控 应用服务中间件 nginx
使用 Docker Compose V2 快速搭建日志分析平台 ELK (Elasticsearch、Logstash 和 Kibana)
ELK的架构有多种,本篇分享使用的架构如图所示: Beats(Filebeat) -> -> Elasticsearch -> Kibana,目前生产环境一天几千万的日志,内存占用大概 10G
473 4
|
7月前
|
存储 Cloud Native 文件存储
云原生之使用Docker部署Nas-Cab个人NAS平台
【5月更文挑战第2天】云原生之使用Docker部署Nas-Cab个人NAS平台
757 4

热门文章

最新文章