DAG 2.0 除了在作业规模等方面继续在业界保持领先之外,架构和功能上有哪些创新?
·业界首次在分布式执行框架上,实现了执行过程中逻辑图和物理图的双重动态可调;
·通过 Bubble 机制实现了混合的计算模式,探索资源利用率和作业性能间的最佳平衡除此之外,DAG 2.0 更加清晰的系统封层架构带来的一个重要改变就是能有利于新功能更快速开发,提速平台和引擎向前创新。由于篇幅有限,本文只能由点及面介绍了一部分新功能与新计算模式,还有许许多多已经实现,或正在开发中的功能,在业界都是全新的探索,暂时不做进一步展开,比如:
·准实时作业体系架构的整体升级: 资源管理与多作业管理的解耦,支持准实时作业场景上的动态图功能;
·常驻的单 container 多 slot 执行的 cache-aware 查询加速服务(MaxCompute 短查询);
·基于状态机的作业节点管理以及失败下的智能重跑机制;
·动态可定义的 shuffle 方式:通过 recursive shuffle 等方式动态解决线上大规模作业中的 in-cast 问题;
·基于 adaptive 的中间数据动态切分与聚合,解决实际分布式作业中各种数据倾斜问题;
·支持 PAI TF GPU 作业的多执行计划选项;
·通过 DAG 执行过程中与优化器的交互,实现渐进式的交互式动态优化; ·支持 Imperative 语言特性,通过 DAG 的动态自增长等能力,对接 IF/ELSE/LOOP 等语义。
以上内容摘自《“伏羲”神算》电子书,点击https://developer.aliyun.com/topic/download?id=873
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。