Spark-zeppelin大数据可视化导入Mysql

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: Zeppelin是基于spark的数据可视化方案。支持scala语言,任何在spark上运行的job都可以在此平台上运行,此外支持对表数据的可视化。对数据源的可视化可以通过interpreter进行扩展,比如github中就有支持MySQL的interpreter。
+关注继续查看

Zeppelin是基于spark的数据可视化方案。支持scala语言,任何在spark上运行的job都可以在此平台上运行,此外支持对表数据的可视化。对数据源的可视化可以通过interpreter进行扩展,比如github中就有支持MySQL的interpreter。

下面着重介绍zeppelin notebook中代码书写:

scala:使用此interpreter的好处是,可以将各个数据源的数据在同一张视图中进行展示。比如以下是对mysql,hive数据的混合展示:

Load mysql表,并注册为spark sqlContext同样的表名:

import java.util.Properties
val properties = new Properties()
val url = "..."
properties.put("user", "...")
properties.put("password", "...")
properties.put("driver", "com.mysql.jdbc.Driver")
val tables = "...,..."
tables.split(",").foreach{mysql_table => 
sqlContext.read.jdbc(url, mysql_table, properties).registerTempTable(mysql_table)
}

Hive数据可以直接进行load:

sql(s"""
  SELECT
  ...
  FROM table where ...""").registerTempTable("hive_table")

对mysql,hive表进行混合查询,支持下拉框:

sql(""select ... from """
 + 
z.select("数据源", Seq(("""mysql_table1""","mysql table1数据"),
                 ("""mysql_table2""","mysql table2数据"),
                 ("""hive_table""","hive数据")))
 + """ where ...""").registerTempTable("result")

效果:


scala中可以使用以下方式对dataframe数据进行展示:
val result = sql("select * from result").rdd.map { r => r.mkString("\t") }.collect().mkString("\n")
println("%table dt\tvalue\n" + result)

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3月前
|
SQL 分布式计算 数据挖掘
Zeppelin调试Spark程序
Zeppelin调试Spark程序
27 0
|
缓存 关系型数据库 MySQL
关于mysql导入大文本txt文件
关于mysql导入大文本txt文件
164 0
关于mysql导入大文本txt文件
|
关系型数据库 MySQL 数据库
mysql导入表时出现的问题,1153
mysql导入表时出现的问题,1153
78 0
|
SQL 关系型数据库 MySQL
MySQL快速导入千万条数据(3)
MySQL快速导入千万条数据(3)
173 0
|
SQL 关系型数据库 MySQL
MySQL快速导入千万条数据(2)
MySQL快速导入千万条数据(2)
306 0
|
SQL Oracle 关系型数据库
MySQL快速导入千万条数据(1)
MySQL快速导入千万条数据(1)
173 0
|
关系型数据库 MySQL 数据库
mysql导入报错 [Err] 1273 – Unknown collation: ‘utf8mb4_0900_ai_ci’
mysql导入报错 [Err] 1273 – Unknown collation: ‘utf8mb4_0900_ai_ci’
mysql导入报错 [Err] 1273 – Unknown collation: ‘utf8mb4_0900_ai_ci’
|
SQL Web App开发 关系型数据库
MySQL---决策支持的基本测试标准TPC-DS测试数据的生成及导入
TPC-DS是tpc组织提供的官方决策支持基本测试标准,这个标准的数据对于决策支持的学习和测试很有帮助,怎样生成测试数据及将测试数据导入到MySQL数据库,可以参阅本文。
1028 0
MySQL---决策支持的基本测试标准TPC-DS测试数据的生成及导入
|
Java 关系型数据库 MySQL
在IDEA中导入mysql驱动
在IDEA中导入mysql驱动详细步骤
646 0
推荐文章
更多