通过ZeppelinHub viewer来分享zeppelin的notebook和报表数据

简介: 最近有使用E-MapReduce的同学咨询如果将zeppelin中的表表数据进行共享。这里就介绍一下在Aliyun E-MapReduce的集群中使用ZeppelinHub来进行notebook和报表的分享。

前言

我们知道,zeppelin有功能强大的交互式notebook,而且能生成非常好的报表数据。但是由于一些安全的原因,我们很少会直接将我们集群的zeppelin服务地址分享给别人,因为在zeppelin notebook中,用户可以直接查询集群的数据甚至执行shell,将这些公开给外部用户是十分危险的。而且有些云计算平台(像Aliyun E-MapReduce, Amazon AWS等)为了安全考虑,关闭了一些端口,需要通过端口转发才能在集群外部环境访问到zeppelin服务,这就使得共享集群zeppelin服务更难。这样的话,我们为了共享我们的交互式报表和数据的时候,就只能通过截图到PDF或者ppt中,然后在发邮件给别人,非常麻烦,而且还无法保存notebook报表上的动态数据提示信息和交换数据。

现在,有了ZeppelinHub viewer,就不用这么麻烦了。ZeppelinHub是一个专门用于分享zeppelin notebook的工具,有自己的账号体系,可以与zeppelin服务集成,进行zeppelin notebook的分享、复制已经多租户的权限管控。ZeppelinHub viewer是它的一个最简单的notebook分享功能,不需要用户提供一个zeppelin服务环境,甚至不需要注册登录ZeppelinHub就能使用。

ali_emr

生成报表

首先,需要分享者在zeppelin服务页面创建notebook,生成一系列的表表数据
report

关于交互式和可视化,可以参考:如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

保存notebook为josn格式

将生成好报表数据的notebook保存为json数据:
save_as_json

注意将该json文件命名为note.json。在ZeppelinHub Viewer使用的时候约定为该名称。

将该json文件上传到oss且设置为公共读(或者放在github上)

upload_oss

将该oss文件的路径粘贴到ZeppelinHub Viewer中

 访问:https://www.zeppelinhub.com/viewer

并且把刚才的note.json文件的路径粘贴过来
zeppelin_viewer

点击“view”就能看到该notebook中的报表和对应的查询sql。
https://www.zeppelinhub.com/viewer/notebooks/aHR0cDovL2Vtci1zYW1wbGUtcHJvamVjdHMub3NzLWNuLWhhbmd6aG91LmFsaXl1bmNzLmNvbS96ZXBwZWxpbi1ub3RlYm9vay1qc29uL25vdGUuanNvbg

只要将这个地址分享出去,就可以访问到报表和notebook,而且安全。

viewer

目录
相关文章
Google Earth Engine(GEE)——导出指定区域的河流和流域范围
Google Earth Engine(GEE)——导出指定区域的河流和流域范围
973 0
|
JavaScript 数据管理 Java
在 Vue 3 中使用 Proxy 实现数据双向绑定的性能如何?
【10月更文挑战第23天】Vue 3中使用Proxy实现数据双向绑定在多个方面都带来了性能的提升,从更高效的响应式追踪、更好的初始化性能、对数组操作的优化到更优的内存管理等,使得Vue 3在处理复杂的应用场景和大量数据时能够更加高效和稳定地运行。
684 156
|
存储 安全 数据挖掘
天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践
天翼云基于 Apache Doris 成功落地项目已超 20 个,整体集群规模超 50 套,部署节点超 3000 个,存储容量超 15PB
907 2
天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践
|
存储 运维 监控
阿里妈妈基于 Flink+Paimon 的 Lakehouse 应用实践
本文总结了阿里妈妈数据技术专家陈亮在Flink Forward Asia 2024大会上的分享,围绕广告业务背景、架构设计及湖仓方案演进展开。内容涵盖广告生态运作、实时数仓挑战与优化,以及基于Paimon的湖仓方案优势。通过分层设计与技术优化,实现业务交付周期缩短30%以上,资源开销降低40%,并大幅提升系统稳定性和运营效率。文章还介绍了阿里云实时计算Flink版的免费试用活动,助力企业探索实时计算与湖仓一体化解决方案。
1298 3
阿里妈妈基于 Flink+Paimon 的 Lakehouse 应用实践
|
SQL JSON DataX
离线数仓(六)【ODS 层开发】
离线数仓(六)【ODS 层开发】
|
jenkins Java 应用服务中间件
代码覆盖率工具-jacoco环境搭建分享
Web多个服务在docker中启动,服务之间存在依赖关系,启动端口号以及依赖的镜像关系都配置在docker-compse.yml文件中。需要借助代码覆盖率工具,对后端Java代码进行覆盖率统计。
代码覆盖率工具-jacoco环境搭建分享
|
Ubuntu Linux Shell
C++ 之 perf+火焰图分析与调试
【10月更文挑战第8天】在遇到一些内存异常的时候,经常这部分的代码是很难去进行分析的,最近了解到Perf这个神器,这里也展开介绍一下如何使用Perf以及如何去画火焰图。
367 1
|
机器学习/深度学习 人工智能 算法
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
|
C++
当前不会命中断点还未为文档加载任何符号
当前不会命中断点还未为文档加载任何符号
532 2
|
分布式计算 算法 大数据
分布式快照算法: Chandy-Lamport
Spark 的 Structured Streaming 的 Continuous Processing Mode 的容错处理使用了分布式快照(Distributed Snapshot)算法 Chandy-Lamport 算法,那么分布式快照算法可以用来解决什么问题呢?
25245 70