SparkSQL实践与优化

简介: SQL实践:1.多数据源支持 2.多数据类型支持 3.多组件对接

_

视频下载地址:https://yunqivedio.alicdn.com/od/Kf8Rb1543482700458.mp4
分享嘉宾:嵩林

PPT下载地址:https://yq.aliyun.com/download/3112

欢迎扫码进群共同交流:
_

相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
2月前
|
SQL 分布式计算 大数据
Paimon 与 Spark 的集成(二):查询优化
通过一系列优化,我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%,已基本和 Parquet x Spark 持平,本文对其中的关键优化点进行了详细介绍。
117516 30
|
4月前
|
SQL 分布式计算 HIVE
sparksql 参数调优
sparksql 参数调优
|
11月前
|
分布式计算 Spark
|
SQL 分布式计算
SparkSQL实践
SparkSQL实战:统计用户及商品数据指标,包含以下三张表
119 0
SparkSQL实践
|
SQL 缓存 分布式计算
PySpark数据分析基础:pyspark.sql.SparkSession类方法详解及操作+代码展示
PySpark数据分析基础:pyspark.sql.SparkSession类方法详解及操作+代码展示
591 0
PySpark数据分析基础:pyspark.sql.SparkSession类方法详解及操作+代码展示
|
SQL 存储 分布式计算
SparkSQL概念介绍
Spark SQL:将sql转换成spark任务
126 0
SparkSQL概念介绍
|
机器学习/深度学习 人工智能 分布式计算
PySpark数据分析基础:PySpark原理详解
PySpark数据分析基础:PySpark原理详解
336 1
PySpark数据分析基础:PySpark原理详解
|
存储 SQL 数据挖掘
Apache Doris Join实现与调优实践
8月 14 号,由示说网和上海白玉兰开源开放研究院联合举办的开源大数据技术线上 Meetup 如期举行,Apache Doris 社区受邀参与本次 Meetup ,来自百度的数据内核高级研发工程师、Apache Doris Contributor 李昊鹏为大家带来了题为“ Apache Doris 的Join实现与调优实践 ”的主题分享,主要介绍了 Apache Doris Join 的实现机制以及调优策略实战,以下是分享内容。
466 0
Apache Doris Join实现与调优实践
|
分布式计算 资源调度 DataWorks
MaxComputeSpark Spark 与 SparkSQL 对比分析及使用注意事项 | 学习笔记
快速学习 MaxComputeSpark Spark 与 SparkSQL 对比分析及使用注意事项
230 0
|
SQL 存储 分布式计算
物化视图在 SparkSQL 中的实践
物化视图作为一种预计算的优化方式,广泛应用于传统数据库中,如Oracle,MSSQL Server等。随着大数据技术的普及,各类数仓及查询引擎在业务中扮演着越来越重要的数据分析角色,而物化视图作为数据查询的加速器,将极大增强用户在数据分析工作中的使用体验。本文将基于 SparkSQL(2.4.4) + Hive (2.3.6), 介绍物化视图在SparkSQL中的实现及应用。
物化视图在 SparkSQL 中的实践