文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

有人知道在dataworks里的pyodps节点里这个报错该怎么解决嘛

展开

收起

游客6vdkhpqtie2h2 2022-10-02 09:19:14 3859 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

4 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！

楼主看看这个：使用限制 PyODPS节点获取本地处理的数据不能超过50 MB，节点运行时占用内存不能超过1 GB，否则节点任务会被系统中止。请避免在PyODPS任务中写额外的Python数据处理代码。在DataWorks上编写代码并进行调试效率较低，为提升运行效率，建议本地安装IDE进行代码开发。在DataWorks上使用PyODPS时，为了防止对DataWorks的Gate Way造成压力，对内存和CPU都有限制，该限制由DataWorks统一管理。如果您发现有Got killed报错，即表明内存使用超限，进程被中止。因此，请尽量避免本地的数据操作。通过PyODPS发起的SQL和DataFrame任务（除to_pandas外）不受此限制。由于缺少matplotlib等包，如下功能可能受限： DataFrame的plot函数。 DataFrame自定义函数需要提交到MaxCompute执行。由于Python沙箱限制，第三方库只支持所有的纯粹Python库以及Numpy，因此不能直接使用Pandas。 DataWorks中执行的非自定义函数代码可以使用平台预装的Numpy和Pandas。不支持其他带有二进制代码的三方包。由于兼容性原因，在DataWorks中，options.tunnel.use_instance_tunnel默认设置为False。如果需要全局开启instance tunnel，需要手动将该值设置为True。由于实现的原因，Python的atexit包不被支持，请使用try-finally结构实现相关功能。 ODPS入口 DataWorks的PyODPS节点中，将会包含一个全局变量odps或者o，即为ODPS入口。您不需要手动定义ODPS入口。 print(o.exist_table('pyodps_iris'))

2022-10-27 12:11:27

赞同展开评论
陈志林

coder at work

注意大小写 from odps import ODPS

2022-10-25 10:26:41

赞同展开评论
离原

pyodps里面已经内置了odps才对,我一直都使用o.来直接调用odps里面的方法

2022-10-24 14:32:04

赞同展开评论
游客tk3vic2jx2lk4

试一下这样操作呢 https://help.aliyun.com/document_detail/90444.html（此答案整理自MaxCompute开发者社区2群）

2022-10-02 09:57:17

赞同展开评论

问答分类：

DataWorks 云原生大数据计算服务 MaxCompute 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks节点大数据开发治理平台 DataWorks pyodps节点大数据开发治理平台 DataWorks pyodps 大数据开发治理平台 DataWorks报错大数据开发治理平台 DataWorks节点报错

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

DataWorks中 pyodps脚本里使用传参就报这个UserWarning怎么办？

392

12

0

DataWorks 运行spark节点，程序logger日志无法展示

265

0

0

DataWorks中PyODPS 要去哪里下载本地的安装包啊？

312

1

0

dataworks上开发pyodps任务，只有独享资源组才能使用第三方包吗？

225

1

0

Dataworks的各任务节点，有同时运行的任务数量限制吗？

252

1

0

DataWorks中pyodps支持使用类似Matplotlib的画图包吗，节点里能使用画图功能么？

273

1

0

在Dataworks中如何配置用户留存模型的任务节点？

187

1

0

DataWorks中hologres sql节点里遇到一个oom的报错？

160

0

0

DataWorks中pyodps 平替 WITH RECURSIVE怎么办？

216

0

0

dataworks中pyodps代码发送结果到群webhook，发布到生产环境报错了，这个怎么解决？

200

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347743

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

大模型长文本处理实践：基于分段提取与结果合并生成结构化摘要

阿里云大数据 AI 产品月刊-2026年6月

阿里云智能决策平台对接使用完全指南：从架构解析到生产级集成实战

阿里云智能决策平台对接使用完全指南：从架构解析到API集成实战

企业如何量化品牌在AI回答场景中的曝光表现

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

MaxCompute中下面图片是什么意思？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

datetime 类型是大数据计算MaxCompute特有的吗？

大数据计算MaxCompute新开一个窗口，粘贴代码过2秒以后，就看到报错：接口异常，请稍后再试？

展开全部

MaxCompute执行作业慢的原因排查

阿里云MaxCompute 2019-5月刊

读透《阿里巴巴数据中台实践》，其到底有什么高明之处？

漫谈阿里大数据

Vectorized Execution Engine in MaxCompute 2.0简介

MaxCompute预付费资源监控工具-CU管家使用教程

阿里云MaxCompute印度开服，加速大数据产业升级

用炸弹开路——加速到来的证券投资行业人工智能时代

面向大数据与云计算调度挑战的阿里经济体核心调度系统—Fuxi 2.0全揭秘

Fuxi2.0—飞天大数据平台调度系统全面升级，首次亮相2019双十一

展开全部

还有其他疑问?