EMR 2.0:重新定义新一代开源大数据平台
时间:14:00-14:30
- 嘉宾:何源(荆杭),阿里云高级产品专家,EMR产品负责人
- 议题介绍:EMR2.0,六年磨一剑!作为国内开源大数据领域引领者,EMR2.0 在平台体验、数据开发、产品形态及数据分析等方面做出全面突破与创新,重新定义新一代开源大数据平台,助力广大用户构建新一代开源大数据基础设施!
EMR 平台:让大数据更简单
时间:14:30-14:50
- 嘉宾:李钰(绝顶),阿里云资深技术专家,EMR平台技术团队负责人
- 议题介绍:全面介绍如何利用EMR新平台实现更加低成本、高效率、智能化的大数据集群管控和应用开发,包括如何在弹性伸缩场景中利用抢占型(spot)实例控制成本、如何通过开启故障实例自动补偿提升集群稳定性、如何使用EMR Doctor提升集群资源使用率和快速排障、如何使用EMR Studio实现高效快速的大数据应用开发上线等。
兼容开源,贡献开源,超越开源
时间:14:50-15:10
- 嘉宾:吴威(无谓),阿里云资深技术专家,数据湖构建与分析负责人
- 议题介绍:以Spark为代表的开源引擎在阿里集群内部有着多年沉淀,并在2016年随阿里云EMR产品对外商业化。EMR计算引擎完全兼容开源生态,并在性能和功能上做了大量扩展。Celeborn是EMR团队开源并贡献给Apache基金会的 Remote Shuffle项目,支持Spark和Flink等引擎在云原生场景部署。除此之外,EMR Spark引擎在超大数据规模、性能、诊断和调优、数据湖存储优化、新硬件适配等实现全面突破,多次刷新CloudSort和TPC-DS世界纪录。
云原生数据湖分析解决方案
时间:15:10-15:40
- 嘉宾1:郑锴(铁杰), 阿里云高级技术专家,数据湖存储负责人
- 嘉宾2:范振(辰繁),阿里云高级技术专家,开源大数据OLAP&生态负责人
- 议题介绍:2022年6月,阿里云云原生数据湖产品通过信通院评测认证!国内首批!国内唯一满分!EMR联合对象存储OSS、数据湖构建DLF、DataWorks等为用户提供“全托管湖存储、全面湖加速、统一湖管理、多模态湖计算和智能湖治理”等全面数据湖能力。 EMR团队基于一湖多架构的理念,计算引擎层面重点投入并回馈了Spark、StarRocks、Trino社区,同时开放兼容了Doris、Impala等社区。另外,EMR即将重磅推出Serverless形态的StarRocks,为您提供全托管一站式的湖仓分析体验,敬请期待!