使用Spark SQL构建交互式查询引擎-阿里云开发者社区

使用Spark SQL构建交互式查询引擎

2016-09-11 5849

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： StreamingPro目前已经涵盖流式/批处理，以及交互查询三个领域，实现配置和SQL化

前言

StreamingPro 原来仅仅是用来作为Spark Streaming的一个配置化+SQL封装，然而不经意间，已经涵盖了批处理，交互式查询等多个方面。今天就讲讲如何使用StreamingPro构建一个交互式查询引擎。

准备工作

下载StreamingPro

README中有下载地址

如果你使用了 Spark 2.0 版本，则要下载对应页面上的Spark 安装包。因为目前Spark 2.0 默认支持Scala 2.11。我提供了一个机遇Scala 2.10版本的。

我们假设您将文件放在了/tmp目录下。

启动StreamingPro

Local模式：

cd  $SPARK_HOME

./bin/spark-submit   --class streaming.core.StreamingApp \
--master local[2] \
--name sql-interactive \
/tmp/streamingpro-0.2.1-SNAPSHOT-dev-1.6.1.jar    \
-streaming.name sql-interactive    \
-streaming.platform spark   \
-streaming.rest true   \
-streaming.driver.port 9004   \
-streaming.spark.service true
        
          
        
        
        
          
          AI 代码解读

访问

http://127.0.0.1:9004/sqlui
        
          
        
        
        
          
          AI 代码解读

后可进入查询界面:

b3213b10e8c5cebc48d334501f03a8cf29d0cead

Snip20160709_5.png

目前支持elasticsearch 索引,HDFS Parquet 等的查询，并且支持多表查询。

除了交互式界面以外，也支持接口查询：

http://127.0.0.1:9004/runtime/spark/sql
        
          
        
        
        
          
          AI 代码解读

参数支持：

2fea15a29bc9ec92a88ba1163829e0f8ce791428

上面的参数都是成套出现，你可以配置多套，从而映射多张表。

集群模式：

cd  $SPARK_HOME

./bin/spark-submit   --class streaming.core.StreamingApp \
--master yarn-cluster \
--name sql-interactive \
/tmp/streamingpro-0.2.1-SNAPSHOT-dev-1.6.1.jar    \
-streaming.name sql-interactive    \
-streaming.platform spark   \
-streaming.rest true   \
-streaming.driver.port 9004   \
-streaming.spark.service true
        
          
        
        
        
          
          AI 代码解读

接着进入spark-ui界面获取driver的地址，就可以访问了。

服务发现

因为集群模式，driver的地址是变化的，所以一旦集群启动后我们需要注册到某个地方，从而能然前端知道。目前支持zookeeper的方式，在启动命令行中添加如下几个参数：

-streaming.zk.servers 127.0.0.1:2181 \
-streaming.zk.conf_root_dir  /streamingpro/jack
        
          
        
        
        
          
          AI 代码解读

之后前端程序只要访问

/streamingpro/jack/address
        
          
        
        
        
          
          AI 代码解读

就能获取IP和端口了。

使用Spark SQL构建交互式查询引擎

前言

准备工作

访问

服务发现

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

使用Spark SQL构建交互式查询引擎

前言

准备工作

访问

服务发现

热门文章

最新文章

相关课程

相关电子书

相关实验场景