抛出问题
都说复盘能力很重要,那么如何进行复盘才是最有效的呢?
我认为基于准确数据分析的复盘才是最有效的,因为不管是拍脑门定需求还是毫无根据的优化迭代都可能导致效果与期望南辕北辙。
今天向大家介绍的是一款非常好用的数据分析可视化平台Superset,有了它我们可以做非常优雅的进行数据探索分析,搭建一目了然的可视化平台。
简介
Superset是一个现代数据探索和可视化平台。
Superset 快速、轻量、直观,并加载了选项,使所有技能的用户都可以轻松地探索和可视化他们的数据,从简单的折线图到高度详细的地理空间图。
特点
功能强大且易于使用
使用简单的无代码可视化构建器或最先进的 SQL IDE,快速轻松地集成和探索数据。
与现代数据库集成
Superset 可以通过 SQLAlchemy 连接到任何基于 SQL 的数据源,包括现代云原生数据库和 PB 级引擎。
现代建筑
Superset 是轻量级且高度可扩展的,可利用现有数据基础架构的强大功能,而无需另一个摄取层。
丰富的可视化和仪表板
Superset 附带了一系列精美的可视化插件,我们还可以根据自己的需求方便的自定义可视化插件,支持拖拽设置。
上效果图
上官图数据
上手极其简单,我花了半小时左右就在自己电脑上搭建出了demo
下面介绍一下部署流程
部署流程
环境说明
Superset 在 Windows 上不受官方支持。Windows 用户在本地试用 Superset 的一种选择是通过 VirtualBox安装 Ubuntu 桌面 VM,并在该 VM 内继续执行 Docker on Linux 指令。
Superset对MacOs和Linux都比较友好,可以直接安装。
下面我以自己使用MacOs的安装流程,为大家演示。
安装流程
1.安装docker
我们需要安装docker。 点击docker官网,下载最新版的docker。
根据电脑芯片类型选择安装版本,我的电脑是intel芯片,所以选择第一个。
小提示:我们可以通过点击Mac左上角的苹果icon,点击弹出的【查看本机】按钮,查看芯片信息。
2.调整Docker内存
打开 Docker 的首选项面板,转到“Resources”部分并将分配的内存增加到 6GB。
小提示:默认情况下仅分配 2GB 的 RAM,Superset 将无法启动。
3.克隆 Superset 的 Github
我们切换到自己准备安装Superset的目录,克隆项目
git clone https://github.com/apache/superset.git
该命令成功完成后,我们就会在目录中看到一个名为superset
的新文件夹。
4.拉取资源
我们使用cd superset
切换到项目目录下
然后执行下面的命令拉取项目需要的资源文件
docker-compose -f docker-compose-non-dev.yml pull
pull命令的执行时间可能比较长,甚至可能因为网络问题中断,如果中断重复执行pull命令就可以了
当文件都下载完成,全部显示done
之后,我们执行up命令
docker-compose -f docker-compose-non-dev.yml up
5.打开docker运行项目
我们打开docker,这时候会发现我们的Images菜单栏中新增了一个apache/superset
,我们点击右侧的【RUN】按钮
我们可以点击Docker的CLI按钮,调起命令行工具,来查看一下Superset的运行的日志。
5. 登录测试
上述全部配置好之后,我们打开:http://localhost:8088
会展示如下图所示的登录页面。
默认的登录账号和密码都是:admin
登录之后我们就可以体验功能了。
我简单体验了一下,控制台支持拖拽设置展示面板。
更多功能
- 用于可视化数据集和制作交互式仪表板的直观界面
- 各种漂亮的可视化效果来展示您的数据
- 用于提取和呈现数据集的无代码可视化构建器
- 用于准备可视化数据的世界级 SQL IDE,包括丰富的元数据浏览器
- 一个轻量级语义层,使数据分析师能够快速定义自定义维度和指标
- 对大多数 SQL 数据库的开箱即用支持
- 无缝的内存异步缓存和查询
- 一种可扩展的安全模型,允许配置非常复杂的规则来决定谁可以访问哪些产品功能和数据集。
- 与主要身份验证后端(数据库、OpenID、LDAP、OAuth、REMOTE_USER 等)集成
- 添加自定义可视化插件的能力
- 用于程序化定制的 API
- 从头开始设计的云原生架构以实现规模化