文档备案控制台

开发者社区大数据与机器学习开源大数据平台 E-MapReduce 文章正文

Apache Spark 系列技术直播 - Spark SQL 实践与优化

2018-11-23 3625

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Apache Spark 系列技术直播 Spark SQL 实践与优化内容简介： SparkSQL介绍基本原理支持的DataSource介绍 Hue/Zepplin/Livy周边跟SparkSQL的集成使用等 SparkSQL优化 SparkSQL Catalyst优化 AE优化 Shuffle优化直播时间： 2018.

直播回看点我

Apache Spark 系列技术直播

Spark SQL 实践与优化

内容简介：

SparkSQL介绍
- 基本原理
- 支持的DataSource介绍
- Hue/Zepplin/Livy周边跟SparkSQL的集成使用等
SparkSQL优化
- SparkSQL Catalyst优化
- AE优化
- Shuffle优化

直播时间： 2018.11.27 周二晚 19：00 - 20：00

欢迎加入钉钉收看直播

入群方式：

文章标签：

开源大数据平台 E-MapReduce

SQL

Apache

分布式计算

Spark

关键词：

SQL优化

Apache实践

Apache技术

SQL实践

apache spark SQL

开源大数据EMR

目录

相关文章

游客nsyhaoxcmeiq6

|

12月前

|

SQL Java 关系型数据库

在 RDB 上跑 SQL------SPL 轻量级多源混算实践 1

SPL 支持通过 JDBC 连接 RDB，可动态生成 SQL 并传参，适用于 Java 与 SQL 结合的各类场景。本文以 MySQL 为例，演示如何配置数据库连接、编写 SPL 脚本查询 2024 年订单数据，并支持参数过滤和 SQL 混合计算。脚本可在 IDE 直接执行或集成至 Java 应用调用。

游客nsyhaoxcmeiq6

235 0 0

智物科技库

|

SQL 存储关系型数据库

SQL优化策略与实践：组合索引与最左前缀原则详解

本文介绍了SQL优化的多种方式，包括优化查询语句（避免使用SELECT *、减少数据处理量）、使用索引（创建合适索引类型）、查询缓存、优化表结构、使用存储过程和触发器、批量处理以及分析和监控数据库性能。同时，文章详细讲解了组合索引的概念及其最左前缀原则，即MySQL从索引的最左列开始匹配条件，若跳过最左列，则索引失效。通过示例代码，展示了如何在实际场景中应用这些优化策略，以提高数据库查询效率和系统响应速度。

智物科技库

793 10 10

拉丁解牛说技术

|

SQL 关系型数据库 MySQL

MySQL进阶突击系列(07) 她气鼓鼓递来一条SQL | 怎么看执行计划、SQL怎么优化?

在日常研发工作当中，系统性能优化，从大的方面来看主要涉及基础平台优化、业务系统性能优化、数据库优化。面对数据库优化，除了DBA在集群性能、服务器调优需要投入精力，我们研发需要负责业务SQL执行优化。当业务数据量达到一定规模后，SQL执行效率可能就会出现瓶颈，影响系统业务响应。掌握如何判断SQL执行慢、以及如何分析SQL执行计划、优化SQL的技能，在工作中解决SQL性能问题显得非常关键。

拉丁解牛说技术

508 13 13

是山河呀

|

SQL 安全关系型数据库

SQL注入之万能密码：原理、实践与防御全解析

本文深入解析了“万能密码”攻击的运行机制及其危险性，通过实例展示了SQL注入的基本原理与变种形式。文章还提供了企业级防御方案，包括参数化查询、输入验证、权限控制及WAF规则配置等深度防御策略。同时，探讨了二阶注入和布尔盲注等新型攻击方式，并给出开发者自查清单。最后强调安全防护需持续改进，无绝对安全，建议使用成熟ORM框架并定期审计。技术内容仅供学习参考，严禁非法用途。

是山河呀

2006 0 0

蓝易云

|

9月前

|

SQL 存储监控

SQL日志优化策略：提升数据库日志记录效率

通过以上方法结合起来运行调整方案, 可以显著地提升SQL环境下面向各种搜索引擎服务平台所需要满足标准条件下之数据库登记作业流程综合表现; 同时还能确保系统稳健运行并满越用户体验预期目标.

蓝易云

434 6 6

游客nsyhaoxcmeiq6

|

11月前

|

SQL 关系型数据库 Java

SQL 移植--SPL 轻量级多源混算实践 7

不同数据库的 SQL 语法存在差异，尤其是函数写法不同，导致 SQL 移植困难。SPL 提供 sqltranslate 函数，可将标准 SQL 转换为特定数据库语法，实现 SQL 语句在不同数据库间的无缝迁移，支持多种数据库函数映射与自定义扩展。

游客nsyhaoxcmeiq6

467 6 6

Aron_NeAr

|

SQL JSON 分布式计算

Spark SQL架构及高级用法

Spark SQL基于Catalyst优化器与Tungsten引擎，提供高效的数据处理能力。其架构涵盖SQL解析、逻辑计划优化、物理计划生成及分布式执行，支持复杂数据类型、窗口函数与多样化聚合操作，结合自适应查询与代码生成技术，实现高性能大数据分析。

Aron_NeAr

838 2 3

技术自由圈/原疯狂创客圈

|

SQL 存储自然语言处理

SQL的解析和优化的原理：一条sql 执行过程是什么？

SQL的解析和优化的原理：一条sql 执行过程是什么？

技术自由圈/原疯狂创客圈

493 3 3

SQL的解析和优化的原理：一条sql 执行过程是什么？

游客mass6jalwg5qm

|

SQL 关系型数据库 MySQL

如何优化SQL查询以提高数据库性能？

这篇文章以生动的比喻介绍了优化SQL查询的重要性及方法。它首先将未优化的SQL查询比作在自助餐厅贪多嚼不烂的行为，强调了只获取必要数据的必要性。接着，文章详细讲解了四种优化策略：**精简选择**（避免使用`SELECT *`）、**专业筛选**（利用`WHERE`缩小范围）、**高效联接**（索引和限制数据量）以及**使用索引**（加速搜索）。此外，还探讨了如何避免N+1查询问题、使用分页限制结果、理解执行计划以及定期维护数据库健康。通过这些技巧，可以显著提升数据库性能，让查询更高效流畅。

游客mass6jalwg5qm

710 18 18

瓴羊Dataphin

|

SQL 分布式计算资源调度

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

瓴羊Dataphin

522 4 4

大数据与机器学习

开源大数据平台 E-MapReduce

热门文章

最新文章

分布式快照算法: Chandy-Lamport

如何使用Kafka Connect实现同步RDS binlog数据

JindoFS: 云上大数据的高性能数据湖存储方案

JindoFS解析 - 云上大数据高性能数据湖存储方案

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

HIVE MapJoin异常问题处理总结

首次揭秘|为6.4亿人次出行提供无线网络的技术架构

5W1H(六何分析法)全景洞察大数据

开源大数据周刊-第90期

从数砖开源 Delta Lake 说起

优路教育借助阿里云Flink+StarRocks+Paimon湖仓一体化构建职业教育业务全链路实时数据服务平台

OpenClaw + QQ 机器人！保姆级图文教程，一步到位

1688商品详情API（1688.item_get）Python实战：构建B2B供应链数据中台

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升

鹰角网络：EMR Serverless Spark 在《明日方舟》游戏业务的应用

一套底座支撑多场景：高德地图基于 Paimon + StarRocks 轨迹服务实践

EMR Serverless Spark 携手 PAI/百炼，开启“SQL 即 AI”的新篇章

诗悦游戏基于DLF与EMR StarRocks降本38%

基于DLF构建实时数据湖

数仓-湖仓-湖流，人力家基于阿里云OpenLake架构演进与思考

相关课程

更多

如何在 PolarDB-X 中优化慢 SQL

SQL完全自学手册

SQL Server on Linux入门教程

SQL入门与实践

数据库及SQL/MySQL基础

SQL进阶及查询

相关电子书

更多

SQL Server 2017

GeoMesa on Spark SQL

原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！