阿里云开源大数据平台EMR全面升级性能最高可提升6倍-阿里云开发者社区

阿里云开源大数据平台EMR全面升级性能最高可提升6倍

2022-12-28 739

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

EMR Serverless StarRocks，5000CU*H 48000GB*H

简介： 12月27日,阿里云正式发布云原生开源大数据平台EMR 2.0，升级后的开源大数据平台在成本持平的情况下，扩缩容性能最高可提升6倍。

12月27日,阿里云正式发布云原生开源大数据平台EMR 2.0，升级后的开源大数据平台在成本持平的情况下，扩缩容性能最高可提升6倍。

据悉，阿里云EMR2.0为用户提供了全新的平台、开发、资源形态、分析场景等更优的产品体验，通过EMR Doctor健康检查、全面的服务巡检和事件通知、节点故障补偿等运维能力的升级，预估运维成本可降低20%-30%。新平台致力于为客户快速构建高性价比、安全可靠、兼容生态的开源大数据平台。

EMR2.0与EMR1.0弹性扩容速度对比

云原生趋势下，开源大数据处于重构之中，以 Hadoop 为核心的开源大数据体系，开始转变为多元化技术并行发展。阿里云EMR产品负责人何源介绍，阿里云EMR于2009年开始服务阿里巴巴集团内部客户，2016年将过往的技术能力产品化开放，为客户提供商业化服务。作为开源大数据领域的引领产品，EMR 2.0通过云原生能力重构平台层、数据层、计算层，满足数千客户流处理、数据可视化、交互式分析、数据湖等多场景需求，重新定义了新一代开源大数据平台。为客户构建新一代开源大数据基础设施。

EMR 2.0产品架构图

客户基于EMR2.0平台可实现更加低成本、高效率、智能化的大数据集群管控和应用开发。通过使用抢占式实例，生产实证最多可降低百分之八十以上的成本。开启故障实例自动补偿，在全场景集群下，稳定性可以提高1个9。全新发布的EMR Doctor，通过健康检查服务的集群日报功能，查看集群是否存在资源浪费；通过任务评分倒排Top N，找到资源浪费最多的作业进行优化；通过持续优化，帮助客户最大化利用资源，避免浪费。同时，还可以帮助客户提前发现一些风险并进行处理。EMR Studio，提供Notebook和Workflow服务。全托管Notebook，兼容用户Jupyter使用习惯，可以无缝对接EMR各计算、存储引擎，进行交互式的大数据开发和调试，已经开发和调试完的作业可以加入Workflow工作流里进行调度和上线。此外EMR Studio的Workflow服务也还支持Flink等的作业。

2022年6月，阿里云EMR联合 OSS、 DLF、DataWorks等构建的云原生数据湖产品方案通过信通院评测认证，是国内首批且唯一满分的产品方案，该方案为用户提供“全托管湖存储、全面湖加速、统一湖管理、多模态湖计算和智能湖治理”等全面数据湖能力。（国内首批！阿里云云原生数据湖产品通过信通院评测认证）

国内知名广告营销服务商汇量科技已使用EMR产品4年。在业务快速增长的大好形势下，汇量科技面临越来越多的困扰：如数据来源复杂、数据量大、数据维度多、实时运营业务秒级数据新鲜度需求等业务需求；本次升级后，汇量科技在素材平台、热力引擎等业务的大数据平台搭建上，数据同步和及查询效率有数倍提升，系统稳定性显著提升，未再出现之前cpu、mem、io负载高等情况。

随着阿里云EMR2.0的发布，阿里云EMR将技术引领优势，转化为云上产品服务能力。重新定义的新一代 EMR 产品，将为各行业广大客户构建开源大数据平台提供最扎实的基座保障。

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

阿里云开源大数据平台EMR全面升级性能最高可提升6倍

开源大数据平台 E-MapReduce

热门文章

最新文章

相关课程

相关电子书

相关实验场景

阿里云开源大数据平台EMR全面升级 性能最高可提升6倍

开源大数据平台 E-MapReduce

热门文章

最新文章

相关课程

相关电子书

相关实验场景

阿里云开源大数据平台EMR全面升级性能最高可提升6倍