大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
MaxCompute
Hologres
Flink
E-MapReduce
DataWorks
Elasticsearch
PAI
智能搜索推荐
Milvus
DataV
免费试用
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
大数据与机器学习
开源大数据平台 E-MapReduce
文章
正文
Apache Spark 系列技术直播 - Spark SQL进阶与实战
2018-12-05
3427
版权
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《
阿里云开发者社区用户服务协议
》和 《
阿里云开发者社区知识产权保护指引
》。如果您发现本社区中有涉嫌抄袭的内容,填写
侵权投诉表单
进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
简介:
Spark SQL进阶与实战 Spark相关组件介绍 Spark及其依赖组件 Hive Metastore介绍 Spark Thrift Server介绍 表与ETL Spark表基本概念 Spark建表最佳实践 Spark ETL最佳实践 动态分区表示例分析 Spark SQL查询最佳实践 Sp.
Spark SQL进阶与实战
Spark相关组件介绍
Spark及其依赖组件
Hive Metastore介绍
Spark Thrift Server介绍
表与ETL
Spark表基本概念
Spark建表最佳实践
Spark ETL最佳实践
动态分区表示例分析
Spark SQL查询最佳实践
Spark SQL查询常见问题
Join优化策略
数据倾斜优化策略
详情请查看附件
欢迎加入钉钉群收看直播回放
入群方式:
文章标签:
开源大数据平台 E-MapReduce
SQL
Apache
分布式计算
Spark
HIVE
关键词:
Apache技术
apache spark SQL
apache spark实战
apache spark技术
SQL spark
开源大数据EMR
目录
相关文章
TiAmoZhang
|
5月前
|
SQL
数据可视化
关系型数据库
MCP与PolarDB集成技术分析:降低SQL门槛与简化数据可视化流程的机制解析
阿里云PolarDB与MCP协议融合,打造“自然语言即分析”的新范式。通过云原生数据库与标准化AI接口协同,实现零代码、分钟级从数据到可视化洞察,打破技术壁垒,提升分析效率99%,推动企业数据能力普惠化。
TiAmoZhang
434
3
3
游客wkqymr43luqiu
|
7月前
|
SQL
JSON
分布式计算
Spark SQL架构及高级用法
Spark SQL基于Catalyst优化器与Tungsten引擎,提供高效的数据处理能力。其架构涵盖SQL解析、逻辑计划优化、物理计划生成及分布式执行,支持复杂数据类型、窗口函数与多样化聚合操作,结合自适应查询与代码生成技术,实现高性能大数据分析。
游客wkqymr43luqiu
501
2
3
瓴羊Dataphin
|
11月前
|
SQL
分布式计算
资源调度
Dataphin功能Tips系列(48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列
如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列
瓴羊Dataphin
423
4
4
wiker24
|
12月前
|
SQL
存储
关系型数据库
【SQL技术】不同数据库引擎 SQL 优化方案剖析
不同数据库系统(MySQL、PostgreSQL、Doris、Hive)的SQL优化策略。存储引擎特点、SQL执行流程及常见操作(如条件查询、排序、聚合函数)的优化方法。针对各数据库,索引使用、分区裁剪、谓词下推等技术,并提供了具体的SQL示例。通用的SQL调优技巧,如避免使用`COUNT(DISTINCT)`、减少小文件问题、慎重使用`SELECT *`等。通过合理选择和应用这些优化策略,可以显著提升数据库查询性能和系统稳定性。
wiker24
551
9
10
技术小达人
|
SQL
分布式计算
Java
Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化
本文摘自 Arm China的工程师顾煜祺关于“在 Arm 平台上使用 Native 算子库加速 Spark”的分享,主要内容包括以下四个部分: 1.技术背景 2.算子库构成 3.算子操作优化 4.未来工作
技术小达人
1735
0
0
赵渝强老师
|
SQL
JSON
分布式计算
【赵渝强老师】Spark SQL的数据模型:DataFrame
本文介绍了在Spark SQL中创建DataFrame的三种方法。首先,通过定义case class来创建表结构,然后将CSV文件读入RDD并关联Schema生成DataFrame。其次,使用StructType定义表结构,同样将CSV文件读入RDD并转换为Row对象后创建DataFrame。最后,直接加载带有格式的数据文件(如JSON),通过读取文件内容直接创建DataFrame。每种方法都包含详细的代码示例和解释。
赵渝强老师
363
0
0
游客j4mujezz7vm7y
|
关系型数据库
MySQL
网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
游客j4mujezz7vm7y
294
1
1
sunrr
|
SQL
存储
监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
sunrr
604
13
14
小王老师呀
|
SQL
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
小王老师呀
423
9
9
以山向海
|
SQL
存储
网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
以山向海
290
6
6
大数据与机器学习
开源大数据平台 E-MapReduce
热门文章
最新文章
1
阿里封神谈hadoop生态学习之路
2
分布式快照算法: Chandy-Lamport
3
现代流式计算的基石:Google DataFlow
4
JindoFS: 云上大数据的高性能数据湖存储方案
5
JindoFS解析 - 云上大数据高性能数据湖存储方案
6
基于Alluxio系统的Spark DataFrame高效存储管理技术
7
HIVE MapJoin异常问题处理总结
8
漫谈分布式计算框架
9
阿里封神-大数据处理技术漫谈
10
JindoFS概述:云原生的大数据计算存储分离方案
1
淘宝闪购基于阿里云 EMR Serverless Spark&Paimon的湖仓实践:超大规模下的特征生产&多维分析双提效
51
2
有奖实践:EMR Serverless StarRocks × Serverless Spark x DLF 共探 TPC 极致性能
223
3
大模型RAG实战:从零搭建专属知识库问答助手
293
4
大模型微调技术入门:从核心概念到实战落地全攻略
305
5
活动报名 | Apache Spark Meetup · 上海站,助力企业构建高效数据平台
210
6
0 基础建站?PageAdmin CMS 10 分钟搞定,源码免费拿!
352
7
EMR AI助手开启公测:用AI重塑大数据运维,更简单、更智能
270
8
EMR StarRocks Stella 内核正式发布,登顶 TPC 榜单全球第一
328
9
QuickSSO 与 ECreator 实操应用案例手册
163
10
StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询
798
相关课程
更多
大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段
SQL完全自学手册
SQL Server on Linux入门教程
SQL入门与实践
数据库及SQL/MySQL基础
SQL进阶及查询
相关电子书
更多
SQL Server在电子商务中的应用与实践
GeoMesa on Spark SQL
原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili
推荐镜像
更多
apache
下一篇
第五届伏魔挑战赛如约来袭,诚邀各路高手来战!