备案控制台

开发者社区大数据文章正文

Spark SQL CLI配置

2023-07-12 145

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Spark SQL CLI配置

Spark SQL CLI配置

SparkSQL可以兼容Hive以便SparkSQL支持Hive表访问、UDF(用户自定义函数)以及Hive查询语言(HiveQL/HQL)。
若要使用SparkSQLCLI的方式访问操作Hive表数据，需要对SparkSQL进行如下所示的环境配置(Spark集群已搭建好)，将SparkSQL连接到一个部署好的Hive上

将hive-site.xml复制到/home/hadoop/app/spark/conf/目录下，所有节点都执行(路径根据自己的输入）
cd /home/hadoop/app/hive/conf/
cp hive-site.xml /home/hadoop/app/spark/conf/
发送给其他两个节点
scp hive-site.xml hadoop@slave1:/home/hadoop/app/spark/conf/
scp hive-site.xml hadoop@slave2:/home/hadoop/app/spark/conf/
在/home/hadoop/app/spark/conf/spark-env.sh文件中配置MySQL驱动。
将MySQL驱动复制到所有节点的spark安装包的jars目录下，并在/home/Hadoop/app/spark/conf/spark-env.sh末尾添加:
export SPARK_CLASSPATH=/home/hadoop/app/spark/jars/mysl-connector-java-5.1.32.jar启动 MySQL 服务
启动 Hive的metastore 服务:hive--service metastore &
修改日志级别:进入/home/hadoop/app/spark/conf，cp log4j.properties.template log4j.properties，修改文件
==log4jproperties==中==log4jrootCategory==的值，修改后==log4jrootCategory=WARN,console==
重新启动Spark集群:进入/home/hadoop/app/spark/sbin/目录，执行./stop-all.sh，再执行./start-all.sh
启动spark-sql:进入/home/hadoop/app/spark/bin目录，执行./spark-sql开启Spark SQL CLI

文章标签：

分布式计算

SQL

关系型数据库

MySQL

Spark

Hadoop

HIVE

关键词：

SQL配置

SQL spark

apache spark SQL

apache spark配置

SQL cli

故事未完·

目录

相关文章

shigen

|

9天前

|

SQL 人工智能 Java

mybatis-plus配置sql拦截器实现完整sql打印

_shigen_ 博主分享了如何在MyBatis-Plus中打印完整SQL，包括更新和查询操作。默认日志打印的SQL用?代替参数，但通过自定义`SqlInterceptor`可以显示详细信息。代码示例展示了拦截器如何替换?以显示实际参数，并计算执行时间。配置中添加拦截器以启用此功能。文章提到了分页查询时的限制，以及对AI在编程辅助方面的思考。

shigen

43 5 5

mybatis-plus配置sql拦截器实现完整sql打印

三分钟热度的鱼

|

14天前

|

SQL 分布式计算大数据

MaxCompute产品使用合集之如何在本地IDE（如IntelliJ IDEA）中配置MaxCompute (mc) 的任务和调试SQL

MaxCompute作为一款全面的大数据处理平台，广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践，可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集，涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

三分钟热度的鱼

76 1 1

让线程再跑一会

|

14天前

|

SQL JSON 分布式计算

Spark SQL【Java API】（2）

Spark SQL【Java API】

让线程再跑一会

85 0 0

让线程再跑一会

|

14天前

|

SQL 分布式计算 Java

Spark SQL【Java API】（1）

Spark SQL【Java API】

让线程再跑一会

90 0 0

FrancekChen

|

1月前

|

SQL 分布式计算关系型数据库

Spark编程实验三：Spark SQL编程

Spark编程实验三：Spark SQL编程

FrancekChen

28 1 1

FrancekChen

|

1月前

|

SQL 分布式计算数据库

Spark SQL

FrancekChen

36 1 1

吃番茄长大的西红柿

|

6天前

|

SQL IDE Java

Java连接SQL Server数据库的详细操作流程

Java连接SQL Server数据库的详细操作流程

吃番茄长大的西红柿

33 2 2

真的很搞笑

|

14天前

|

SQL DataWorks NoSQL

DataWorks产品使用合集之如何将SQL Server中的数据转存到MongoDB

DataWorks作为一站式的数据开发与治理平台，提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案，帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述，涵盖数据处理的各个环节。

真的很搞笑

242 1 5

真的很搞笑

|

1月前

|

SQL API 流计算

实时计算 Flink版产品使用合集之在Mac M1下的Docker环境中开启SQL Server代理的操作步骤是什么

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

真的很搞笑

161 1 1

以山向海

|

8天前

|

SQL 存储关系型数据库

关系型数据库中的SQL Server

【6月更文挑战第11天】

以山向海

44 3 3

热门文章

最新文章

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

Spark如何对源端数据做切分？

Spark Packages寻宝（一）：简单易用的数据准备工具Optimus

spark-streaming-kafka-0-8 官网讲解

Spark 分析网站排名热度

NEC新技术带来比Apach Spark快50倍的机器学习能力

2 分钟读懂大数据框架 Hadoop 和 Spark 的异同

hadoop/spark节点动态调整

流式大数据处理的三种框架：Storm，Spark和Samza

Spark中RDD、DataFrame、DataSet的生成与互相转换（非常重要）

mysql一条sql查询出多个统计结果

启动mysq异常The server quit without updating PID file [FAILED]sql/data/***.pi根本解决方案

【MySQL】慢SQL分析流程

java.sql.SQLException: No operations allowed after statement closed.

一文搞懂SQL优化——如何高效添加数据

【MySQL技术之旅】（7）总结和盘点优化方案系列之常用SQL的优化

Cause: java.sql.SQLIntegrityConstraintViolationException: Column ‘id‘ in field list is ambiguous

Auditing SQL Statements, Privileges, and Other General Activities

SQL，Group By 真扎心，原来是这样

踏踏实实练习SQL--day09

相关课程

更多

如何在 PolarDB-X 中优化慢 SQL

SQL完全自学手册

SQL Server on Linux入门教程

SQL入门与实践

数据库及SQL/MySQL基础

SQL进阶及查询

相关电子书

更多

SQL Server 2017

GeoMesa on Spark SQL

原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili

相关实验场景

更多

PolarDB for AI：在数据库中通过SQL实现AI能力

玩转MaxCompute SQL! 30分钟搞定数据分析挖掘

使用SQL语句实现数据表管理

使用SQL语句实现数据插入、修改和删除操作

使用SQL语句实现数据查询操作

使用SQL语句管理索引

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）