通过ZeppelinHub viewer来分享zeppelin的notebook和报表数据

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 最近有使用E-MapReduce的同学咨询如果将zeppelin中的表表数据进行共享。这里就介绍一下在Aliyun E-MapReduce的集群中使用ZeppelinHub来进行notebook和报表的分享。

前言

我们知道,zeppelin有功能强大的交互式notebook,而且能生成非常好的报表数据。但是由于一些安全的原因,我们很少会直接将我们集群的zeppelin服务地址分享给别人,因为在zeppelin notebook中,用户可以直接查询集群的数据甚至执行shell,将这些公开给外部用户是十分危险的。而且有些云计算平台(像Aliyun E-MapReduce, Amazon AWS等)为了安全考虑,关闭了一些端口,需要通过端口转发才能在集群外部环境访问到zeppelin服务,这就使得共享集群zeppelin服务更难。这样的话,我们为了共享我们的交互式报表和数据的时候,就只能通过截图到PDF或者ppt中,然后在发邮件给别人,非常麻烦,而且还无法保存notebook报表上的动态数据提示信息和交换数据。

现在,有了ZeppelinHub viewer,就不用这么麻烦了。ZeppelinHub是一个专门用于分享zeppelin notebook的工具,有自己的账号体系,可以与zeppelin服务集成,进行zeppelin notebook的分享、复制已经多租户的权限管控。ZeppelinHub viewer是它的一个最简单的notebook分享功能,不需要用户提供一个zeppelin服务环境,甚至不需要注册登录ZeppelinHub就能使用。

ali_emr

生成报表

首先,需要分享者在zeppelin服务页面创建notebook,生成一系列的表表数据
report

关于交互式和可视化,可以参考:如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

保存notebook为josn格式

将生成好报表数据的notebook保存为json数据:
save_as_json

注意将该json文件命名为note.json。在ZeppelinHub Viewer使用的时候约定为该名称。

将该json文件上传到oss且设置为公共读(或者放在github上)

upload_oss

将该oss文件的路径粘贴到ZeppelinHub Viewer中

 访问:https://www.zeppelinhub.com/viewer

并且把刚才的note.json文件的路径粘贴过来
zeppelin_viewer

点击“view”就能看到该notebook中的报表和对应的查询sql。
https://www.zeppelinhub.com/viewer/notebooks/aHR0cDovL2Vtci1zYW1wbGUtcHJvamVjdHMub3NzLWNuLWhhbmd6aG91LmFsaXl1bmNzLmNvbS96ZXBwZWxpbi1ub3RlYm9vay1qc29uL25vdGUuanNvbg

只要将这个地址分享出去,就可以访问到报表和notebook,而且安全。

viewer

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
目录
相关文章
|
5月前
|
数据可视化 安全 数据挖掘
Tableau快速入门-下载安装加载数据与仪表盘构建
Tableau快速入门-下载安装加载数据与仪表盘构建
Tableau快速入门-下载安装加载数据与仪表盘构建
|
数据可视化 安全 网络安全
Window下安装并使用InfluxDB可视化工具 —— InfluxDBStudio
Window下安装并使用InfluxDB可视化工具 —— InfluxDBStudio
3352 0
Window下安装并使用InfluxDB可视化工具 —— InfluxDBStudio
Zeppelin安装与配置
本文介绍zeppelin安装与配置指南
Zeppelin安装与配置
|
5月前
|
SQL 关系型数据库 MySQL
Hive【基础知识 02-1】【Hive CLI 命令行工具使用】【准备阶段-建库、建表、导入数据、编写测试SQL脚本并上传HDFS】
【4月更文挑战第7天】Hive【基础知识 02-1】【Hive CLI 命令行工具使用】【准备阶段-建库、建表、导入数据、编写测试SQL脚本并上传HDFS】
71 0
|
5月前
|
SQL 关系型数据库 MySQL
SuperSet服务安装
SuperSet服务安装
183 0
|
5月前
|
SQL 缓存 分布式计算
Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存
Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存
144 0
|
数据可视化 关系型数据库 MySQL
Apache Superset 1.2.0教程 (三)—— 图表功能详解
通过之前章节的学习,我们已经成功地安装了superset,并且连接mysql数据库,可视化了王者英雄的数据。使用的是最简单Table类型的图表,但是superset还支持非常多的图表类型。 本文我们将对各种图表类型进行逐一的演示,文章较长。
948 0
Apache Superset 1.2.0教程 (三)—— 图表功能详解
Jupyter无法导出pdf以及报错解决方案
Jupyter无法导出pdf以及报错解决方案
1399 0
Jupyter无法导出pdf以及报错解决方案
|
SQL 关系型数据库 MySQL
03-PDI(Kettle)导入与导出CDC(中)
文章目录 03-PDI(Kettle)导入与导出CDC 数据的全量、增量、差异备份 基于时间戳的源数据CDC 实验原理 实验步骤 基于触发器的CDC 实验原理
03-PDI(Kettle)导入与导出CDC(中)
|
SQL 存储 安全
03-PDI(Kettle)导入与导出CDC(上)
文章目录 03-PDI(Kettle)导入与导出CDC 数据的全量、增量、差异备份 基于时间戳的源数据CDC 实验原理 实验步骤 基于触发器的CDC 实验原理
03-PDI(Kettle)导入与导出CDC(上)