开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

分布式作业的 DAG,有哪两种层面的表述?

已解决

分布式作业的 DAG,有哪两种层面的表述?

展开
收起
游客lmkkns5ck6auu 2022-08-10 11:06:18 351 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    逻辑图与物理图。简单地来说 (over-simplified),终端用户平时理解的 DAG 拓扑,大多数情况下描述的是逻辑图范畴:比如大家平时看到的 logview 图,虽然里面包含了一些物理信息(每个逻辑节点的并发度),但整体上可以认为描述的就是作业执行流程的逻辑图。

    ·逻辑图描述了用户想要实现的数据处理流程,从数据库 /SQL 的角度(其他类型引擎也都有类似之处,比如 TENSORFLOW) 来看,可以大体认为 DAG 的逻辑图,是对优化器执行计划的一个延续;

    ·物理图更多描述了执行计划映射到物理分布式集群的具体描述,体现的是执行计划被物化到分布式系统上,具备的一些特性:比如并发度,数据传输方式等等。

    以上内容摘自《“伏羲”神算》电子书,点击https://developer.aliyun.com/topic/download?id=873

    2022-08-10 18:07:49
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
高并发分布式缓存Redis6.0 立即下载
基于社区的分布式 风险感知模型 立即下载
如何利用Redisson分布式化传统Web项目 立即下载

相关实验场景

更多