开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

DAG 2.0 除了在作业规模等方面继续在业界保持领先之外,架构和功能上有哪些创新?

已解决

DAG 2.0 除了在作业规模等方面继续在业界保持领先之外,架构和功能上有哪些创新?

展开
收起
游客lmkkns5ck6auu 2022-08-10 11:19:23 395 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    ·业界首次在分布式执行框架上,实现了执行过程中逻辑图和物理图的双重动态可调;

    ·通过 Bubble 机制实现了混合的计算模式,探索资源利用率和作业性能间的最佳平衡除此之外,DAG 2.0 更加清晰的系统封层架构带来的一个重要改变就是能有利于新功能更快速开发,提速平台和引擎向前创新。由于篇幅有限,本文只能由点及面介绍了一部分新功能与新计算模式,还有许许多多已经实现,或正在开发中的功能,在业界都是全新的探索,暂时不做进一步展开,比如:

    ·准实时作业体系架构的整体升级: 资源管理与多作业管理的解耦,支持准实时作业场景上的动态图功能;

    ·常驻的单 container 多 slot 执行的 cache-aware 查询加速服务(MaxCompute 短查询);

    ·基于状态机的作业节点管理以及失败下的智能重跑机制;

    ·动态可定义的 shuffle 方式:通过 recursive shuffle 等方式动态解决线上大规模作业中的 in-cast 问题;

    ·基于 adaptive 的中间数据动态切分与聚合,解决实际分布式作业中各种数据倾斜问题;

    ·支持 PAI TF GPU 作业的多执行计划选项;

    ·通过 DAG 执行过程中与优化器的交互,实现渐进式的交互式动态优化; ·支持 Imperative 语言特性,通过 DAG 的动态自增长等能力,对接 IF/ELSE/LOOP 等语义。

    以上内容摘自《“伏羲”神算》电子书,点击https://developer.aliyun.com/topic/download?id=873

    2022-08-11 10:26:25
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
MaxCompute Serverless 架构演进 立即下载
阿里云消息队列的 Serverless架构演进 立即下载
青团社云原生架构实践—亿级灵活用工平台的架构实践 立即下载