通过ZeppelinHub viewer来分享zeppelin的notebook和报表数据

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 最近有使用E-MapReduce的同学咨询如果将zeppelin中的表表数据进行共享。这里就介绍一下在Aliyun E-MapReduce的集群中使用ZeppelinHub来进行notebook和报表的分享。

前言

我们知道,zeppelin有功能强大的交互式notebook,而且能生成非常好的报表数据。但是由于一些安全的原因,我们很少会直接将我们集群的zeppelin服务地址分享给别人,因为在zeppelin notebook中,用户可以直接查询集群的数据甚至执行shell,将这些公开给外部用户是十分危险的。而且有些云计算平台(像Aliyun E-MapReduce, Amazon AWS等)为了安全考虑,关闭了一些端口,需要通过端口转发才能在集群外部环境访问到zeppelin服务,这就使得共享集群zeppelin服务更难。这样的话,我们为了共享我们的交互式报表和数据的时候,就只能通过截图到PDF或者ppt中,然后在发邮件给别人,非常麻烦,而且还无法保存notebook报表上的动态数据提示信息和交换数据。

现在,有了ZeppelinHub viewer,就不用这么麻烦了。ZeppelinHub是一个专门用于分享zeppelin notebook的工具,有自己的账号体系,可以与zeppelin服务集成,进行zeppelin notebook的分享、复制已经多租户的权限管控。ZeppelinHub viewer是它的一个最简单的notebook分享功能,不需要用户提供一个zeppelin服务环境,甚至不需要注册登录ZeppelinHub就能使用。

ali_emr

生成报表

首先,需要分享者在zeppelin服务页面创建notebook,生成一系列的表表数据
report

关于交互式和可视化,可以参考:如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

保存notebook为josn格式

将生成好报表数据的notebook保存为json数据:
save_as_json

注意将该json文件命名为note.json。在ZeppelinHub Viewer使用的时候约定为该名称。

将该json文件上传到oss且设置为公共读(或者放在github上)

upload_oss

将该oss文件的路径粘贴到ZeppelinHub Viewer中

 访问:https://www.zeppelinhub.com/viewer

并且把刚才的note.json文件的路径粘贴过来
zeppelin_viewer

点击“view”就能看到该notebook中的报表和对应的查询sql。
https://www.zeppelinhub.com/viewer/notebooks/aHR0cDovL2Vtci1zYW1wbGUtcHJvamVjdHMub3NzLWNuLWhhbmd6aG91LmFsaXl1bmNzLmNvbS96ZXBwZWxpbi1ub3RlYm9vay1qc29uL25vdGUuanNvbg

只要将这个地址分享出去,就可以访问到报表和notebook,而且安全。

viewer

相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
目录
相关文章
|
1月前
|
数据可视化 安全 数据挖掘
Tableau快速入门-下载安装加载数据与仪表盘构建
Tableau快速入门-下载安装加载数据与仪表盘构建
Tableau快速入门-下载安装加载数据与仪表盘构建
|
数据可视化 安全 网络安全
Window下安装并使用InfluxDB可视化工具 —— InfluxDBStudio
Window下安装并使用InfluxDB可视化工具 —— InfluxDBStudio
3215 0
Window下安装并使用InfluxDB可视化工具 —— InfluxDBStudio
Zeppelin安装与配置
本文介绍zeppelin安装与配置指南
Zeppelin安装与配置
|
1月前
|
SQL 缓存 分布式计算
Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存
Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存
119 0
|
数据可视化 关系型数据库 MySQL
Apache Superset 1.2.0教程 (三)—— 图表功能详解
通过之前章节的学习,我们已经成功地安装了superset,并且连接mysql数据库,可视化了王者英雄的数据。使用的是最简单Table类型的图表,但是superset还支持非常多的图表类型。 本文我们将对各种图表类型进行逐一的演示,文章较长。
851 0
Apache Superset 1.2.0教程 (三)—— 图表功能详解
|
存储 XML 缓存
01-PDI(Kettle)简介与安装
文章目录 01-PDI(Kettle)简介与安装 PDI(Kettle)简介 Kettle安装 Kettle核心知识点
01-PDI(Kettle)简介与安装
|
Java 数据库
用户指南—数据导入和导出—使用Batch Tool工具导入导出数据
本文介绍了通过Batch Tool工具导入导出数据的方法。
129 0
|
Python
Jupyter Notebook使用说明
Jupyter Notebook使用说明
100 0
Jupyter Notebook使用说明
|
SQL JSON 数据可视化
(一)Superset 1.3图表篇——Table
本系列文章基于Superset 1.3.0版本。1.3.0版本目前支持分布,趋势,地理等等类型共59张图表。本次1.3版本的更新图表有了一些新的变化,而之前也一直没有做过非常细致的图表教程。 而且目前可以参考的资料有限,大部分还需要自己探索。所以本系列文章将对这59张图表的使用做一个整理。 Superset的安装入门,以及数据集的准备,请参考之前的教程,1.3版本依然可用。
792 0
(一)Superset 1.3图表篇——Table
|
分布式计算 资源调度 Hadoop
PyFlink 开发环境利器:Zeppelin Notebook
在 Zeppelin notebook 里利用 Conda 来创建 Python env 自动部署到 Yarn 集群中。
PyFlink 开发环境利器:Zeppelin Notebook