阿里云EMR 2.0重磅发布直播间

云原生趋势下,开源大数据处于重构之中,以 Hadoop 为核心的开源大数据体系,从 2015 年开始转变为多元化技术并行发展。阿里云EMR作为开源大数据领域的引领者,迎来重磅升级,从平台体验、数据开发、资源形态、分析场景等方面实现全面创新。通过云原生能力重构平台层、数据层、计算层,满足万千客户流处理、数据可视化、交互式分析、数据湖等多场景需求,为客户构建新一代开源大数据基础设施!

提示信息

正在为您切换到 , 请稍后...
3

发布议程

EMR 2.0:重新定义新一代开源大数据平台
时间:14:00-14:30
  • 嘉宾:何源(荆杭),阿里云高级产品专家,EMR产品负责人
  • 议题介绍:EMR2.0,六年磨一剑!作为国内开源大数据领域引领者,EMR2.0 在平台体验、数据开发、产品形态及数据分析等方面做出全面突破与创新,重新定义新一代开源大数据平台,助力广大用户构建新一代开源大数据基础设施!
EMR 平台:让大数据更简单
时间:14:30-14:50
  • 嘉宾:李钰(绝顶),阿里云资深技术专家,EMR平台技术团队负责人
  • 议题介绍:全面介绍如何利用EMR新平台实现更加低成本、高效率、智能化的大数据集群管控和应用开发,包括如何在弹性伸缩场景中利用抢占型(spot)实例控制成本、如何通过开启故障实例自动补偿提升集群稳定性、如何使用EMR Doctor提升集群资源使用率和快速排障、如何使用EMR Studio实现高效快速的大数据应用开发上线等。
兼容开源,贡献开源,超越开源
时间:14:50-15:10
  • 嘉宾:吴威(无谓),阿里云资深技术专家,数据湖构建与分析负责人
  • 议题介绍:以Spark为代表的开源引擎在阿里集群内部有着多年沉淀,并在2016年随阿里云EMR产品对外商业化。EMR计算引擎完全兼容开源生态,并在性能和功能上做了大量扩展。Celeborn是EMR团队开源并贡献给Apache基金会的 Remote Shuffle项目,支持Spark和Flink等引擎在云原生场景部署。除此之外,EMR Spark引擎在超大数据规模、性能、诊断和调优、数据湖存储优化、新硬件适配等实现全面突破,多次刷新CloudSort和TPC-DS世界纪录。
云原生数据湖分析解决方案
时间:15:10-15:40
  • 嘉宾1:郑锴(铁杰), 阿里云高级技术专家,数据湖存储负责人
  • 嘉宾2:范振(辰繁),阿里云高级技术专家,开源大数据OLAP&生态负责人
  • 议题介绍:2022年6月,阿里云云原生数据湖产品通过信通院评测认证!国内首批!国内唯一满分!EMR联合对象存储OSS、数据湖构建DLF、DataWorks等为用户提供“全托管湖存储、全面湖加速、统一湖管理、多模态湖计算和智能湖治理”等全面数据湖能力。 EMR团队基于一湖多架构的理念,计算引擎层面重点投入并回馈了Spark、StarRocks、Trino社区,同时开放兼容了Doris、Impala等社区。另外,EMR即将重磅推出Serverless形态的StarRocks,为您提供全托管一站式的湖仓分析体验,敬请期待!

EMR 2.0新特性

全新平台体验
集群创建速度优化2倍以上;集群扩容速度提升3倍以上 ;弹性规模支持上千台;一站式智能诊断和优化服务
全新数据开发
可视化协同应用程序开发环境;100%兼容 Jupyter;自动适配EMR计算引擎;企业级数据开发治理
全新资源形态
EMR on ECS,支持倚天g8,性价比提升超40%;EMR on ACK,容器化管理,降本增效;EMR Serverless,开放灵活
全新分析场景
支持新版数据湖、数据分析、数据服务、数据流、数据科学等众多场景;满足万千客户需求

适用场景

新版数据湖 DataLake
兼容Hadoop生态,适用于大数据离线处理、实时处理和交互式查询等场景
数据分析 OLAP
满足用户画像、人群圈选、BI报表和业务分析等一系列业务场景
实时数据流 DataFlow
广泛应用于实时数据ETL和日志采集分析等场景
数据服务 DataServing
基于OSS-HDFS解耦计算集群与数据存储
数据科学 DataScience
面向大数据+AI 场景

产品体验