原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 通过简单的几步配置,教你如何快速实现MaxCompute的数据可视化
+关注继续查看

注:MaxCompute原名ODPS,是阿里云自研的大数据计算平台,文中出现的MaxCompute与ODPS都指代同一平台,不做区分

Zeppelin简介

Zeppelin是一款基于web的notebook工具,它支持以插件的方式接入各种解释器(interpreter),从而使用户能够以特定的语言或数据处理后端来完成交互式查询,并快速实现数据可视化。

部署Zeppelin

首先,你需要在部署的服务器上安装Oracle JDK 1.7,并配置好相应的JAVA_HOME环境变量,这步不做赘述。

接着,我们需要获取Zeppelin,推荐你下载官网最新的发行包

下载后解压到服务器上的某个目录下,比如笔者解压到了本地目录:/Users/emerson/develop_tools/zeppelin-0.6.1-bin-all,该目录即为zeppelin的根目录了。在根目录下执行:

% bin/zeppelin-daemon.sh start
Zeppelin start                                             [  OK  ]

这说明zeppelin已经部署成功。

在浏览器中访问zeppelin主页,由于笔者部署在本机,而zeppelin默认启动在8080端口,所以访问的地址是:http://127.0.0.1:8080/, 你将看到类似如下的页面。默认情况下,你已经以匿名的方式访问到zeppelin。

1

配置新的Interpreter

接着,我们来为MaxCompute JDBC创建一个Interpreter。

首先,我们需要下载携带有完整依赖的MaxCompute JDBC的jar包。请从这里获取最新的稳定版:odps-jdbc-1.9-jar-with-dependencies.jar。

然后回到zeppelin页面,用鼠标点击右上角的“anonymous”,在弹出的下拉列表中选择“Interpreter”。

2

你将进入如下页面,然后点击右上角的“+Create”按钮。

3

接着,便进入了解释器的新建页面,如下图:

4

填入Interpreter的名称和分组,分别是“odps”和“jdbc”。

然后增减并修改配置如下:

5

其中 default.user 和 default.password 分别是你在MaxCompute对应的 accessID 和 accessKey 。而 default.url 则是对应的MaxCompute JDBC的URL,请注意替换其中的project名,此处笔者使用的是odpsdemo。

而Dependencies处的artifact填写之前下载的odps-jdbc-1.9-jar-with-dependencies.jar的本地路径。

完成配置后保存并重启该名为odps的Interpreter。

新建notebook

现在,你便可以新建notebook来测试该Interpreter了。

用鼠标点击上方的“Notebook”按钮,并选择“+Create new note”,如下图所示:

6

为新note命名为“odps_jdbc”,如下图:

7

在新的note页面点击右上角的“齿轮”按钮,完成note与新Interpreter的绑定,如下图所示:

8

将名为“odps”的Interpreter选中并拖拽到顶部,作为默认的Interpreter使用。

保存后,即可在note中输入符合MaxCompute SQL语法的SQL,点击运行按钮完成数据查询:

9

实现数据可视化

Zeppelin提供了非常丰富且简单的可视化功能,点击如下图中的可视化选项,完成简单的setting配置,即可看到不同种类的可视化图表了:
10
11
12
13

欢迎加入MaxCompute钉钉群讨论

03ea92a4c1fbb04d443ff8f015c957815055111e

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
分布式计算 MaxCompute
《零基础实现Flume收集网站日志数据到MaxCompute》电子版地址
零基础实现Flume收集网站日志数据到MaxCompute
58 0
《零基础实现Flume收集网站日志数据到MaxCompute》电子版地址
|
分布式计算 Hadoop MaxCompute
《零基础实现hadoop 迁移 MaxCompute 之 数据》电子版地址
零基础实现hadoop 迁移 MaxCompute 之 数据迁移
51 0
《零基础实现hadoop 迁移 MaxCompute 之 数据》电子版地址
|
分布式计算 Hadoop MaxCompute
《零基础实现hadoop 迁移 MaxCompute 之 数据迁移》电子版地址
零基础实现hadoop 迁移 MaxCompute 之 数据迁移
64 0
《零基础实现hadoop 迁移 MaxCompute 之 数据迁移》电子版地址
|
存储 SQL 分布式计算
MaxCompute 公共云多租户设计的技术要点详解及产品实现特色
公共云大数据平台在多租户的设计和实现方式上有所差异。本文主要介绍在公共云大数据平台的多租实现方案中需要考虑的问题和挑战,重点介绍了MaxCompute在计算和存储多租实现上的特点。期望通过这些介绍来让大家了解大数据云平台多租方案需要关注的技术点和MaxCompute在多租实现上的产品特色。
1012 1
MaxCompute 公共云多租户设计的技术要点详解及产品实现特色
|
SQL 分布式计算 DataWorks
MaxCompute最佳实践:SQL实现一行变多行&多行变一行
本文对Dataworks里一行变多行&多行变一行进行实践,其中多行变一行是对现有实践的一个引用,方便大家查找
|
分布式计算 DataWorks 网络协议
MaxCompute中实现IPv4和IPv6地址归属地转换
大数据平台的成熟使得更多种类的非结构化、半结构化的数据分析成为可能。其中把IP地址转换为归属地又是极为常见的一种场景。本文将介绍在MaxCompute如何根据IPv4和IPv6地址实现归属地转换。
3514 0
MaxCompute中实现IPv4和IPv6地址归属地转换
|
分布式计算 运维 DataWorks
阿里云Dataworks数据集成工具实现:OTS -> Maxcompute数据同步
数据集成主要用于离线(批量)数据同步。离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间数据传输。结合用户在使用OTS数据源同步的时候容易出现问题,这里演示:OTS数据源同步数据到Maxcompute的具体实现步骤。
1218 0
阿里云Dataworks数据集成工具实现:OTS -> Maxcompute数据同步
|
SQL 分布式计算 关系型数据库
优化(2)MaxCompute 实现增量数据推送(全量比对增量逻辑)
MaxCompute(ODPS2.0) - 试用新的集合操作命令 EXCEPT & 增量识别
2418 1
|
分布式计算 数据可视化 小程序
友盟+联合EB级云数据仓库 MaxCompute 实现友盟域和企业私域数据全面融合
国内领先的第三方全域数据智能服务商友盟+,联合阿里云EB级云数据仓库 MaxCompute 为企业提供面向分析的,实现友盟域数据与企业私域数据全面融合的自助分析服务“U-DOP数据开放”。
737 0
友盟+联合EB级云数据仓库 MaxCompute 实现友盟域和企业私域数据全面融合
|
弹性计算 分布式计算 算法
【云栖号案例 | 互联网】MaxCompute助力千寻位置实现3秒厘米级定位
定位的本质是数据计算,对精度和速度有高要求。混合云架构下,机密数据在专有云完成,大规模数据计算在大数据平台完成,定位数据播发在公共云进行。
相关产品
云原生大数据计算服务 MaxCompute
推荐文章
更多
推荐镜像
更多