开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中ODPS sql 执行计划是什么?

DataWorks中ODPS sql 执行计划是什么?

展开
收起
真的很搞笑 2023-07-13 09:44:45 164 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在 DataWorks 中,ODPS SQL 执行计划是指在执行 SQL 查询时,ODPS 系统根据查询语句和表的统计信息等信息生成的查询执行计划。查询执行计划包括查询的物理执行流程、执行顺序、数据分布情况、IO 操作等关键信息,用于描述查询的执行过程和资源消耗情况。
    具体而言,ODPS SQL 执行计划可以帮助您了解 SQL 查询的执行过程、性能瓶颈和优化空间,以便优化查询性能和提高数据分析效率。执行计划通常包括以下几个部分:
    查询计划图:显示查询的物理执行流程和执行顺序。查询计划图通常以树形结构展现,每个节点表示一个 SQL 操作,例如扫描表、合并数据、排序等。
    数据分布情况:显示查询涉及的表的数据分布情况,包括数据分区和分布式数据的分布情况等。
    统计信息:显示查询涉及的表的统计信息,例如行数、列数、数据均值、方差等。
    资源消耗:显示查询消耗的计算资源和存储资源,例如 CPU 时间、内存使用量

    2023-07-30 18:25:45
    赞同 展开评论 打赏
  • 在DataWorks中,ODPS SQL执行计划(Execution Plan)是指查询优化器生成的执行计划信息,描述了ODPS(MaxCompute)引擎在执行SQL查询时的具体操作步骤和顺序。

    执行计划可以帮助您理解和分析SQL查询的执行过程,包括数据的读取、操作和输出等。它提供了查询优化器针对您的SQL语句进行优化的结果,以及每个阶段的具体操作和数据流动路径。

    ODPS SQL执行计划通常包含以下重要的元素:

    1. 执行顺序:执行计划会显示查询各个操作的执行顺序,从上到下表示执行的先后顺序。

    2. 数据输入和输出:执行计划会显示涉及的表或数据源,以及数据的输入和输出方式。这可以帮助您了解数据来源和数据写入位置。

    3. 操作类型:执行计划会显示每个操作所涉及的具体操作类型,如扫描、过滤、聚合、连接等,以及相应的算子和函数。

    4. 分区和列信息:执行计划还提供了分区和列的相关信息,可以帮助您理解查询在不同分区和列上的处理方式。

    2023-07-13 13:29:37
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载