介绍
Superset 是什么?
Apache Superset 是一个开源的现代的、企业级的商业智能 web 应用程序。是一个数据可视化和数据探索平台。
Apache Superset 被设计成一个标准的云原生(Cloud-Native)应用,与 Kubernetes 结合的非常的好。(Superset 这个系列的后续文章 为少
会和大家详细探讨)
Superset 提供
- 一个直观的界面,以探索和可视化数据集,并创建交互式仪表板。
- 大量漂亮的可视化组件来展示您的数据。(其实并不太漂亮😂)
- 简单,无代码的用户流程,可以对爆露在仪表板下的数据进行细分和切分。仪表板和图表是进行深入分析的起点。
- 最先进的SQL编辑器/IDE提供了丰富的元数据浏览器,以及从任何结果集创建可视化的简单工作流。
- 可扩展的高粒度安全模型,允许有关谁可以访问哪些产品功能和数据集的复杂规则。可以与主流的身份验证后端(数据库,OpenID,LDAP,OAuth,REMOTE_USER等)集成。
- 轻量级语义层,允许通过定义维度和指标来控制如何将数据源公开给用户。
- 支持对大多数 sql 语言数据库的开箱即用
- 与 Druid 的深度集成允许 Superset 在切割大型实时数据集时保持极快的速度
- 具有可配置缓存,可快速加载仪表板
项目和文档
- 官方 GitHub
- 官方文档
- 笔者 Fork 后的项目
从最新的 release 拉一个新的分支
基于 tag 0.37.0
拉出一个新分支 0.37.0-echarts
git branch 0.37.0-echarts 0.37.0 git checkout 0.37.0-echarts
修改 Dockerfile
因为在城内,所以需修改相关 pip 镜像源。加速 Image 的构建。
具体修改如下:
FROM preset/superset:dev COPY ./requirements* ./docker/requirements* /app/ USER root RUN cd /app \ && pip config set global.index-url https://mirrors.cloud.tencent.com/pypi/simple \ && pip install -e . \ && pip install --no-cache -r requirements.txt -r requirements-dev.txt \ && pip install --no-cache -r requirements-extra.txt \ && pip install --no-cache -r requirements-local.txt || true USER superset
初始化数据
注意,这里有坑,至少在城内
这个坑得填一下。
下载示例数据
从 github 下载:examples-data
启动一个静态服务器
由于为少
的电脑是 Mac。它是自带 python 2
的,所以我可以直接:
cd examples-data python -m SimpleHTTPServer # Serving HTTP on 0.0.0.0 port 8000 ...
静态服务器,大家本地愿意用啥都行。
修改 examples 里面的 BASE_URL
看一下本机 IP:
ifconfig
找到相关代码,更改即可。
执行初始化命令
docker-compose up superset-init
OK,完美搞定示例数据。
本地开发
启动 Superset 前端开发服务器
docker-compose up superset-node
启动 Superset Flask 服务器
docker-compose up superset
启动 Superset Celery Worker 服务器
docker-compose up superset-worker
成功之后,我们进入 http://localhost:8088/。
用户名/密码都是 admin
。
登录成功后,我们看到可视化面板列表。
看到没,我们当前的版本是 0.37.0
。
我们进入 World Bank's Data
面板。
我们探索下 Growth Rate
。