DataWorks产品使用合集之怎么批量获取数据地图的实例id

本文涉及的产品
DataWorks Serverless资源组免费试用套餐,300CU*H 3个月
简介: DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

问题一:DataWorks中pydodps实现递归函数对数据量有限制吗?


DataWorks中pydodps实现递归函数对数据量有限制吗?


参考回答:

会涉及到遍历之类的吗 应该是看内部的实现逻辑 例如,使用到了pandas要加载到本地处理数据的 dw上调度加载到本地上限是50m,其他pyodps的限制可以看看文档中有没有标注 https://pyodps.readthedocs.io/zh-cn/latest/?spm=a2c4g.11186623.0.0.38ff4c1eNPPOzj 


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/626142



问题二:DataWorks表a有3个字段aa、oldaa、idoldaa等于改表其他条数aa字段该如何实现?


DataWorks表a有3个字段aa、oldaa、id。oldaa等于改表其他条数aa字段,以此类推(循环次数不确定),想找到最早的aa字段。该如何实现?


参考回答:

oldaa等于改表其他条数aa字段----没有太理解 ,前面部分表述了oldaa为一个字段,mc本身不支持递归查询 可以尝试用pydodps实现递归函数


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/626141



问题三:DataWorks如果是普通节点上下游传值怎么弄?


DataWorks如果是普通节点上下游传值怎么弄,我测试了使用系统参数没啥问题,就自定义的始终没反应?


参考回答:

因为pyodps节点不支持将计算结果通过节点上下文传递给下游;仅支持传递一个常量 比如固定的字符串abc,一般通过赋值节点传递结果值 或者特殊的emr hive 节点支持“赋值参数”


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/626139



问题四:DataWorks中py3脚本调度配置->节点上下文->本节点输出参数中怎么传值给自定义参数?


DataWorks中py3脚本调度配置->节点上下文->本节点输出参数中怎么传值给自定义参数,并能在下游脚本使用该参数的值?


参考回答:

传值给自定义参数-----是传递常量值还是pydops脚本计算结果值给下游呢 后者应该不支持,可以考虑赋值节点 https://help.aliyun.com/zh/dataworks/user-guide/configure-an-assignment-node?spm=a2c4g.11186623.0.i2

或者将计算结果写入临时表 后面的节点读取临时表中的数据


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/626137



问题五:DataWorks有没有办法批量拿到数据地图的实例id?


DataWorks有没有办法批量拿到数据地图的实例id?


参考回答:

好像不行 元数据的api看起来也没有这块 https://help.aliyun.com/zh/dataworks/developer-reference/api?spm=a2c4g.11186623.0.i7#p-yvs-f31-m9h 


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/626136

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
20天前
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
25天前
|
SQL DataWorks 安全
DataWorks产品使用合集之如何实现分钟级调度
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
运维 DataWorks 监控
DataWorks产品使用合集之如何自定义UDTF
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
分布式计算 DataWorks API
DataWorks产品使用合集之如何设置把结果传入变量
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
DataWorks 监控 Java
DataWorks产品使用合集之怎么查看并发数和jvm对应值
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
存储 分布式计算 DataWorks
DataWorks产品使用合集之如何引用第三方库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
分布式计算 运维 DataWorks
DataWorks产品使用合集之如何实现任务的批量导入和导出
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
DataWorks 监控 安全
DataWorks产品使用合集之怎么设置实时同步任务的速率和并发
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
DataWorks 安全 关系型数据库
DataWorks产品使用合集之如何修改责任人
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
DataWorks 安全 定位技术
DataWorks产品使用合集之怎么指定任务的执行时间
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

相关产品

  • 大数据开发治理平台 DataWorks