备案控制台

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中pyodps 3支持哪些python 库？

DataWorks中pyodps 3支持哪些python 库？

展开

收起

真的很搞笑 2023-05-28 20:45:52 159 0

1 条回答

写回答

取消提交回答

芯在这

PyODPS节点获取本地处理的数据不能超过50 MB，节点运行时占用内存不能超过1 GB，否则节点任务会被系统中止。请避免在PyODPS任务中写额外的Python数据处理代码。在DataWorks上编写代码并进行调试效率较低，为提升运行效率，建议本地安装IDE进行代码开发。在DataWorks上使用PyODPS时，为了防止对DataWorks的Gate Way造成压力，对内存和CPU都有限制，该限制由DataWorks统一管理。如果您发现有Got killed报错，即表明内存使用超限，进程被中止。因此，请尽量避免本地的数据操作。通过PyODPS发起的SQL和DataFrame任务（除to_pandas外）不受此限制。由于缺少matplotlib等包，如下功能可能受限：DataFrame的plot函数。DataFrame自定义函数需要提交到MaxCompute执行。由于Python沙箱限制，第三方库只支持所有的纯粹Python库以及Numpy，因此不能直接使用Pandas。DataWorks中执行的非自定义函数代码可以使用平台预装的Numpy和Pandas。不支持其他带有二进制代码的三方包。由于兼容性原因，在DataWorks中，options.tunnel.use_instance_tunnel默认设置为False。如果需要全局开启instance tunnel，需要手动将该值设置为True。由于实现的原因，Python的atexit包不被支持，请使用try-finally结构实现相关功能。 https://help.aliyun.com/document_detail/90444.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-05-28 21:07:46

赞同展开评论打赏

问答分类：

DataWorks Python 大数据开发治理平台 DataWorks

问答标签：

Python库大数据开发治理平台 DataWorks库大数据开发治理平台 DataWorks pyodps 大数据开发治理平台 DataWorks python Python dataworks

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关产品：

大数据开发治理平台 DataWorks

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

DataWorks完全不同的两种类型做比较，结果竟然相等（python）？

49

1

0

DataWorks中python 引用 archive的包怎么办？

61

1

0

DataWorks中PyODPS 要去哪里下载本地的安装包啊？

55

1

0

DataWorks中python里面没有类似的方法吗，python代码执行报错？

50

0

0

DataWorks中pyodps支持使用类似Matplotlib的画图包吗，节点里能使用画图功能么？

43

1

0

DataWorks中pyodps这个工具可以写机器学习模型嘛？如何突破50m的限制？

46

1

0

DataWorks中 mysql 同步到mysql 没有整库同步的选项吗？

38

1

0

遇到了这类需求，在dataworks里面的python脚本中，引用了一个服务器地址？

42

1

0

DataWorks有个开发环境数据源连通报错的问题，生产库正常。麻烦帮忙看看？

44

1

0

我用最基础的Hello world用例测了一下，发现python的函数执行速度比java快很多【py

1125

2

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关产品

大数据开发治理平台 DataWorks

文档详情产品详情

热门讨论

热门文章

数据来源：com.alibaba.fastjson.JSONException: syntax er

dataworks里面的stg层、ods层、dwd层、dws层、是怎么分层的呢？

Dataphin和 Dataworks 有啥区别呢？

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

请教一下DataWorks，doris和starRocks 选型，选哪个？

如果不同的RAM子账号由于权限分配原因，看不到别的工作空间下的任务名称，如果重名了怎么办？

请问 Argument list too long怎么解决？

数据服务报429请求次数过多咋办呀

DataWorks我该如何访问A项目安装了项目的package资源？

DataWorks中odps SQL 参数如何获取前一天的yyyymm？

展开全部

DataWorks智能数据建模全面公测开始啦！

DataWorks售前咨询

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks操作报错合集之错误提示“ODPS-0130161: Parse exception - invalid token 'WITH', expect 'SEMICOLON'”，该怎么办

【2023云栖】田奇铣：大模型驱动DataWorks数据开发治理平台智能化升级

【云栖实录】DataWorks：新一代智能湖仓一体数据开发与治理平台

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

DataWorks操作报错合集之离线同步时，报错信息"Out of range value for column 'A' at row 1" ，表示什么意思

展开全部

相关课程

更多

高校精品课-华东师范大学 - Python数据科学基础与实践

826

101

去学习

【科技少年】Python基础语法

1554

24

去学习

【科技少年】Python绘画编程第一课

4379

20

去学习

一站式大数据开发治理平台DataWorks初级课程

1219

11

去学习

DataWorks一站式大数据开发治理平台精品课程

8490

35

去学习

相关电子书

更多

DataWorks数据集成实时同步最佳实践（含内测邀请）-2020飞天大数据平台实战应用第一季 立即下载

DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载

DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载

相关实验场景

更多