Spark-zeppelin大数据可视化导入Mysql-阿里云开发者社区

Spark-zeppelin大数据可视化导入Mysql

2016-05-26 1640

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS AI 助手，专业版

RDS Agent（兼容OpenClaw），2核4GB

RDS MySQL DuckDB 分析主实例，集群系列 4核8GB

简介： Zeppelin是基于spark的数据可视化方案。支持scala语言，任何在spark上运行的job都可以在此平台上运行，此外支持对表数据的可视化。对数据源的可视化可以通过interpreter进行扩展，比如github中就有支持MySQL的interpreter。

Zeppelin是基于spark的数据可视化方案。支持scala语言，任何在spark上运行的job都可以在此平台上运行，此外支持对表数据的可视化。对数据源的可视化可以通过interpreter进行扩展，比如github中就有支持MySQL的interpreter。

下面着重介绍zeppelin notebook中代码书写：

scala：使用此interpreter的好处是，可以将各个数据源的数据在同一张视图中进行展示。比如以下是对mysql，hive数据的混合展示：

Load mysql表，并注册为spark sqlContext同样的表名：

import java.util.Properties
val properties = new Properties()
val url = "..."
properties.put("user", "...")
properties.put("password", "...")
properties.put("driver", "com.mysql.jdbc.Driver")
val tables = "...,..."
tables.split(",").foreach{mysql_table =>
sqlContext.read.jdbc(url, mysql_table, properties).registerTempTable(mysql_table)
}

Hive数据可以直接进行load：

sql(s"""
SELECT
...
FROM table where ...""").registerTempTable("hive_table")

对mysql，hive表进行混合查询，支持下拉框：

sql(""select ... from """
+
z.select("数据源", Seq(("""mysql_table1""","mysql table1数据"),
("""mysql_table2""","mysql table2数据"),
("""hive_table""","hive数据")))
+ """ where ...""").registerTempTable("result")

效果：

scala中可以使用以下方式对dataframe数据进行展示：
val result = sql("select * from result").rdd.map { r => r.mkString("\t") }.collect().mkString("\n")
println("%table dt\tvalue\n" + result)

Spark-zeppelin大数据可视化导入Mysql

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark-zeppelin大数据可视化导入Mysql

热门文章

最新文章

相关课程

相关电子书

推荐镜像