【含视频+文字版】《从开源到云原生,你不得不知的大数据实战》| 2020 大数据技术公开课第一季

简介: 亲爱的大数据开发者们,新年好!在过去的2019年中,MaxCompute开发者社区共举办了六季大数据技术公开课,也受到广大开发者们的认可和鼓励。2月份我们已经紧锣密鼓的筹备了新年的第一季大数据技术公开课—《从开源到云原生,你不得不知的大数据实战》,欢迎各位开发者们一起参加。

在这特殊的日子里,MaxCompute开发者社区始终与大数据开发者们一起,我们化禁足为学习,化长体重为长知识,一起来吧,亲爱的们!

2020年的第一季公开课,聚焦开源与云原生的大数据技术与产品,通过比较和实操,帮助开发者们更好的理解和掌握大数据技术。


【直播主题】MaxCompute Spark与Spark SQL对比分析及使用注意事项
【直播时间】2020年2月17日
【分享嘉宾】吴雷(沐行) 阿里云智能 高级售后技术工程师
【直播简介】本次直播主要介绍Spark on MaxCompute和开源Spark上的区别,讲解加实战演示 Spark on MaxCompute如何使用。
直播回放 >>>
阅读文字版 >>>


【直播主题】MaxCompute SQL 与 Hive对比分析及使用注意事项
【直播时间】2020年2月18日
【分享嘉宾】刘建伟 阿里云智能 技术支持工程师
【直播简介】本次直播主要讲解MaxCompute SQL开发与开源Hive的对比以及兼容性问题的介绍。各位开发者在云上开发过程中需要注意的事项也会做详细介绍。
直播回放 >>>
阅读文字版 >>>

【直播主题】阿里云实时计算与Spark Streaming对比分析及使用注意事项
【直播时间】2020年2月21日
【分享嘉宾】龙青云 阿里云智能 技术支持工程师
【直播简介】本次直播主要讲解阿里云实时计算和开源Spark Streaming对比,以及实时计算简介和入门实操。
直播回放 >>>
阅读文字版 >>>

【直播主题】数据集成与Sqoop对比分析及使用注意事项
【直播时间】2020年2月25日
【分享嘉宾】张雅静 阿里云智能 技术支持工程师
【直播简介】本次直播将介绍 DataWorks 数据集成与开源 Sqoop 的对比,讲解如何通过 数据集成介绍实现数据的同步。
直播回放 >>>
阅读文字版 >>>

【直播主题】阿里云交互式分析与Presto对比分析及使用注意事项
【直播时间】2020年2月28日
【分享嘉宾】耿江涛 阿里云智能 技术支持工程师
【直播简介】本次直播主要讲解阿里云交互式分析的使用场景和相关的操作步骤,对比Presto架构和使用方式,介绍交互式分析和Presto两者之间的操作及语法区别和注意事项。
直播回放 >>>
阅读文字版 >>>


观看渠道:MaxCompute开发者社区钉钉群

扫描二维码加入钉钉群社区
1.jpg

往期大数据技术公开课回看

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
11月前
|
存储 SQL 监控
数据中台架构解析:湖仓一体的实战设计
在数据量激增的数字化时代,企业面临数据分散、使用效率低等问题。数据中台作为统一管理与应用数据的核心平台,结合湖仓一体架构,打通数据壁垒,实现高效流转与分析。本文详解湖仓一体的设计与落地实践,助力企业构建统一、灵活的数据底座,驱动业务决策与创新。
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
存储 SQL 分布式计算
别让你的数据“裸奔”!大数据时代的数据隐私保护实战指南
别让你的数据“裸奔”!大数据时代的数据隐私保护实战指南
762 19
|
12月前
|
人工智能 分布式计算 大数据
大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)
本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。
634 0
|
8月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
519 7
|
SQL 分布式计算 大数据
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容,并通过互联网广告和物流行业案例分析,展示其实际应用。具有专业性、可操作性和参考价值。
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
|
Kubernetes Cloud Native 开发者
alibaba-load-balancer-controller v1.2.0:开启云原生网关开源新篇章!敬请探索!
alibaba-load-balancer-controller v1.2.0:开启云原生网关开源新篇章!敬请探索!
399 61
|
Cloud Native 关系型数据库 分布式数据库
PolarDB开源:云原生数据库的新篇章
阿里云自研的云原生数据库PolarDB于2023年5月正式开源,采用“存储计算分离”架构,具备高性能、高可用及全面兼容性。其开源版本提供企业级数据库解决方案,支持MySQL、PostgreSQL和Oracle语法,适用于高并发OLTP、核心业务系统等场景。PolarDB通过开放治理与开发者工具构建完整生态,并展望更丰富的插件功能与AI集成,为中国云原生数据库技术发展贡献重要力量。
857 17
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
554 4

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute