SparkSQL实践与优化

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: SQL实践:1.多数据源支持 2.多数据类型支持 3.多组件对接

_

视频下载地址:https://yunqivedio.alicdn.com/od/Kf8Rb1543482700458.mp4
分享嘉宾:嵩林

PPT下载地址:https://yq.aliyun.com/download/3112

欢迎扫码进群共同交流:
_

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
6月前
|
SQL 存储 分布式计算
SparkSQL整合Alluxio实操
SparkSQL整合Alluxio实操
68 0
|
6月前
|
SQL 分布式计算 大数据
Paimon 与 Spark 的集成(二):查询优化
通过一系列优化,我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%,已基本和 Parquet x Spark 持平,本文对其中的关键优化点进行了详细介绍。
118262 30
|
6月前
|
SQL 分布式计算 HIVE
sparksql 参数调优
sparksql 参数调优
|
机器学习/深度学习 人工智能 分布式计算
PySpark数据分析基础:PySpark原理详解
PySpark数据分析基础:PySpark原理详解
422 1
PySpark数据分析基础:PySpark原理详解
|
SQL 分布式计算
SparkSQL实践
SparkSQL实战:统计用户及商品数据指标,包含以下三张表
166 0
SparkSQL实践
|
SQL 存储 分布式计算
SparkSQL概念介绍
Spark SQL:将sql转换成spark任务
158 0
SparkSQL概念介绍
|
SQL 缓存 分布式计算
PySpark数据分析基础:pyspark.sql.SparkSession类方法详解及操作+代码展示
PySpark数据分析基础:pyspark.sql.SparkSession类方法详解及操作+代码展示
782 0
PySpark数据分析基础:pyspark.sql.SparkSession类方法详解及操作+代码展示
|
分布式计算 资源调度 DataWorks
MaxComputeSpark Spark 与 SparkSQL 对比分析及使用注意事项 | 学习笔记
快速学习 MaxComputeSpark Spark 与 SparkSQL 对比分析及使用注意事项
276 0
|
SQL 分布式计算 Shell
HiveSQL到SparkSQL在滴滴的实践
HiveSQL到SparkSQL在滴滴的实践
HiveSQL到SparkSQL在滴滴的实践
|
SQL 存储 分布式计算
物化视图在 SparkSQL 中的实践
物化视图作为一种预计算的优化方式,广泛应用于传统数据库中,如Oracle,MSSQL Server等。随着大数据技术的普及,各类数仓及查询引擎在业务中扮演着越来越重要的数据分析角色,而物化视图作为数据查询的加速器,将极大增强用户在数据分析工作中的使用体验。本文将基于 SparkSQL(2.4.4) + Hive (2.3.6), 介绍物化视图在SparkSQL中的实现及应用。
物化视图在 SparkSQL 中的实践