阿里云EMR 2.0重磅发布

面向未来构建新一代开源大数据基础设施

阿里云EMR 2.0重磅发布直播间

云原生趋势下，开源大数据处于重构之中，以 Hadoop 为核心的开源大数据体系，从 2015 年开始转变为多元化技术并行发展。阿里云EMR作为开源大数据领域的引领者，迎来重磅升级，从平台体验、数据开发、资源形态、分析场景等方面实现全面创新。通过云原生能力重构平台层、数据层、计算层，满足万千客户流处理、数据可视化、交互式分析、数据湖等多场景需求，为客户构建新一代开源大数据基础设施！

3

发布议程

EMR 2.0：重新定义新一代开源大数据平台

时间：14:00-14:30

嘉宾：何源(荆杭)，阿里云高级产品专家，EMR产品负责人
议题介绍：EMR2.0，六年磨一剑！作为国内开源大数据领域引领者，EMR2.0 在平台体验、数据开发、产品形态及数据分析等方面做出全面突破与创新，重新定义新一代开源大数据平台，助力广大用户构建新一代开源大数据基础设施！

EMR 平台：让大数据更简单

时间：14:30-14:50

嘉宾：李钰(绝顶)，阿里云资深技术专家，EMR平台技术团队负责人
议题介绍：全面介绍如何利用EMR新平台实现更加低成本、高效率、智能化的大数据集群管控和应用开发，包括如何在弹性伸缩场景中利用抢占型(spot)实例控制成本、如何通过开启故障实例自动补偿提升集群稳定性、如何使用EMR Doctor提升集群资源使用率和快速排障、如何使用EMR Studio实现高效快速的大数据应用开发上线等。

兼容开源，贡献开源，超越开源

时间：14:50-15:10

嘉宾：吴威(无谓)，阿里云资深技术专家，数据湖构建与分析负责人
议题介绍：以Spark为代表的开源引擎在阿里集群内部有着多年沉淀，并在2016年随阿里云EMR产品对外商业化。EMR计算引擎完全兼容开源生态，并在性能和功能上做了大量扩展。Celeborn是EMR团队开源并贡献给Apache基金会的 Remote Shuffle项目，支持Spark和Flink等引擎在云原生场景部署。除此之外，EMR Spark引擎在超大数据规模、性能、诊断和调优、数据湖存储优化、新硬件适配等实现全面突破，多次刷新CloudSort和TPC-DS世界纪录。

云原生数据湖分析解决方案

时间：15:10-15:40

嘉宾1：郑锴(铁杰)，阿里云高级技术专家，数据湖存储负责人
嘉宾2：范振(辰繁)，阿里云高级技术专家，开源大数据OLAP&生态负责人
议题介绍：2022年6月，阿里云云原生数据湖产品通过信通院评测认证！国内首批！国内唯一满分！EMR联合对象存储OSS、数据湖构建DLF、DataWorks等为用户提供“全托管湖存储、全面湖加速、统一湖管理、多模态湖计算和智能湖治理”等全面数据湖能力。 EMR团队基于一湖多架构的理念，计算引擎层面重点投入并回馈了Spark、StarRocks、Trino社区，同时开放兼容了Doris、Impala等社区。另外，EMR即将重磅推出Serverless形态的StarRocks，为您提供全托管一站式的湖仓分析体验，敬请期待！