原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化-阿里云开发者社区

开发者社区> 楚项> 正文

原来MaxCompute还能这么玩系列(1)—— 通过Apache Zeppelin 快速实现数据可视化

简介: 通过简单的几步配置,教你如何快速实现MaxCompute的数据可视化
+关注继续查看

注:MaxCompute原名ODPS,是阿里云自研的大数据计算平台,文中出现的MaxCompute与ODPS都指代同一平台,不做区分

Zeppelin简介

Zeppelin是一款基于web的notebook工具,它支持以插件的方式接入各种解释器(interpreter),从而使用户能够以特定的语言或数据处理后端来完成交互式查询,并快速实现数据可视化。

部署Zeppelin

首先,你需要在部署的服务器上安装Oracle JDK 1.7,并配置好相应的JAVA_HOME环境变量,这步不做赘述。

接着,我们需要获取Zeppelin,推荐你下载官网最新的发行包

下载后解压到服务器上的某个目录下,比如笔者解压到了本地目录:/Users/emerson/develop_tools/zeppelin-0.6.1-bin-all,该目录即为zeppelin的根目录了。在根目录下执行:

% bin/zeppelin-daemon.sh start
Zeppelin start                                             [  OK  ]

这说明zeppelin已经部署成功。

在浏览器中访问zeppelin主页,由于笔者部署在本机,而zeppelin默认启动在8080端口,所以访问的地址是:http://127.0.0.1:8080/, 你将看到类似如下的页面。默认情况下,你已经以匿名的方式访问到zeppelin。

1

配置新的Interpreter

接着,我们来为MaxCompute JDBC创建一个Interpreter。

首先,我们需要下载携带有完整依赖的MaxCompute JDBC的jar包。请从这里获取最新的稳定版:odps-jdbc-1.9-jar-with-dependencies.jar。

然后回到zeppelin页面,用鼠标点击右上角的“anonymous”,在弹出的下拉列表中选择“Interpreter”。

2

你将进入如下页面,然后点击右上角的“+Create”按钮。

3

接着,便进入了解释器的新建页面,如下图:

4

填入Interpreter的名称和分组,分别是“odps”和“jdbc”。

然后增减并修改配置如下:

5

其中 default.user 和 default.password 分别是你在MaxCompute对应的 accessID 和 accessKey 。而 default.url 则是对应的MaxCompute JDBC的URL,请注意替换其中的project名,此处笔者使用的是odpsdemo。

而Dependencies处的artifact填写之前下载的odps-jdbc-1.9-jar-with-dependencies.jar的本地路径。

完成配置后保存并重启该名为odps的Interpreter。

新建notebook

现在,你便可以新建notebook来测试该Interpreter了。

用鼠标点击上方的“Notebook”按钮,并选择“+Create new note”,如下图所示:

6

为新note命名为“odps_jdbc”,如下图:

7

在新的note页面点击右上角的“齿轮”按钮,完成note与新Interpreter的绑定,如下图所示:

8

将名为“odps”的Interpreter选中并拖拽到顶部,作为默认的Interpreter使用。

保存后,即可在note中输入符合MaxCompute SQL语法的SQL,点击运行按钮完成数据查询:

9

实现数据可视化

Zeppelin提供了非常丰富且简单的可视化功能,点击如下图中的可视化选项,完成简单的setting配置,即可看到不同种类的可视化图表了:
10
11
12
13

欢迎加入MaxCompute钉钉群讨论

03ea92a4c1fbb04d443ff8f015c957815055111e

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
智能数据引擎Dataphin重磅发布,提供一站式的技术管理能力
面对各行各业日趋强烈的大数据建设、管理及应用诉求,2018年2月28日MWC大会,阿里云重磅推出了智能数据构建与管理平台Dataphin——从数据接入到数据消费全链路,提供一站式的大数据能力,包括产品、技术和方法论等,致力于助力企业打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系。
9476 0
SQLite数据库常用语句及MAC上的SQLite可视化工具MeasSQLlite使用(二)
SQLite数据库常用语句及MAC上的SQLite可视化工具MeasSQLlite使用
15 0
解决伪分布式hadoop部署hive后,无法通过beeline连接
应用场景 当在伪分布式hadoop2.6.0集群中,部署添加了hive2.1.1后,发现输入hive命令,可以进行连接hive,但是用beeline连接连不上。
1816 0
SQLite数据库常用语句及MAC上的SQLite可视化工具MeasSQLlite使用(一)
SQLite数据库常用语句及MAC上的SQLite可视化工具MeasSQLlite使用
15 0
+关注
楚项
大数据粉,编程语言爱好者,云计算从业者
7
文章
0
问答
来源圈子
更多
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载