开发者社区精选直播合集 | Spark最佳实践

2020-08-13 2072

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎，Spark是一种与Hadoop相似的开源集群计算环境，但Spark在某些工作负载方面表现得更加优越，本合集整理Spark最佳实践分享，带你直观感受它的优越性，并从“巨人”肩上大受启发，速藏！

往期精选合集包（戳我前往）

囊括了：AI、架构师、 Serverless 、AIoT、DevOps、容器化、机器学习、云计算、K8s、微服务、云原生、视觉AI、大数据、小程序、物联网等各种主题直播合集。

Spark SQL模型变为在线服务

讲师：王太泽，第四范式特征工程数据库负责人
推荐理由：SparkSQ在机器学习场景中应用模型从批量到实时面临的问题诸如SparkSQL转换成实时执行成本高、离线特征和在线特征保持一致困难、离线效果与在线效果差距大等如何解？本视频一直致力于解决机器学习模型从离线到在线特征一致性问题和性能问题的第四范式特征工程数据库负责人王太泽给你分享经验，并用SparkSQL实时上线demo给你分析他们与传统实现方式的优势。戳我观看

基于 Spark 打造高效云原生数据分析引擎

讲师：辛庸，阿里巴巴计算平台事业部 EMR 技术专家
推荐理由：由阿里巴巴 EMR 团队提交的 TPC-DS 成绩如何能在九月份的榜单中取得了排名第一的成绩？本视频阿里巴巴计算平台事业部 EMR 技术专家选取一些有代表性的优化点，深入到技术细节做详细介绍，带你了解动态过滤、CBO增强、TopK排序等等,给你展示这个成绩背后EMR 团队对 Spark 执行引擎持续不断的优化成果。戳我观看

Tblestore结合Spark的云上流批一体大数据架构

讲师：王卓然，花名琸然阿里云存储服务技术专家
推荐理由：传统Lambda架构组件多运维复杂，如何使用一套存储和一套计算来实现流批架构充分享受技术红利？以Delta Lake为代表的新型数据湖方案越来越流行，传统的Lambda架构如何向数据湖架构进行扩展？以及结构化数据结合Delta Lake的最佳解决方案是什么。本视频阿里云存储服务技术专家琸然结合理论讲解和实际场景为你一一解答。戳我观看

基于Spark与TensorFlow的机器学习实践

讲师：吴威（无谓），阿里巴巴高级技术专家
推荐理由：Apache Spark是目前最火热的计算框架， TensorFlow是目前最火热的机器学习框架，两者个碰撞到一起会产生什么巨大的火花？本视频通过EMR和PAI在这个上面的实践给你展示。戳我观看

Spark Relational Cache实现亚秒级响应的交互式分析

讲师：王道远（健身），阿里云EMR技术专家
推荐理由：Apache Spark被广泛用于超大规模的数据分析处理，在交互式分析等时间敏感的场景中，超大规模数据量的处理时间可能无法满足用户快速响应的需求怎么办？本视频阿里云EMR技术专家王道远通过Spark Relational Cache的实现原理和使用场景，带你了解如何通过数据的预组织和预计算，将频繁访问的数据和计算提前执行并保存在Relational Cache中，优化后续特定模式的查询，显著提高查询速度，实现亚秒级的响应。戳我观看

开发者社区精选直播合集 | Spark最佳实践

往期精选合集包（戳我前往）

Spark SQL模型变为在线服务

基于 Spark 打造高效云原生数据分析引擎

Tblestore结合Spark的云上流批一体大数据架构

基于Spark与TensorFlow的机器学习实践

Spark Relational Cache实现亚秒级响应的交互式分析

开发者学习资源库

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开发者社区精选直播合集 | Spark最佳实践

往期精选合集包（戳我前往）

开发者学习资源库

热门文章

最新文章

相关课程

相关电子书