文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

如何在datawork上弄python3的pandas 库？

如何在datawork上弄python3的pandas 库？

展开

收起

真的很搞笑 2024-03-04 08:42:06 294 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks上使用Python 3的Pandas库，您需要通过PyODPS节点来实现。以下是具体的步骤：
1. 创建PyODPS 3节点：您需要在DataWorks的数据开发页面创建一个PyODPS 3节点，因为PyODPS 3节点底层支持Python 3语言版本。
2. 编写MaxCompute作业：在创建好的PyODPS 3节点中，您可以直接使用Python代码编写MaxCompute作业。PyODPS提供了DataFrame接口来处理MaxCompute对象，并且可以转换成Pandas进行数据操作。
3. 配置调度参数：在开发PyODPS任务代码时，您可以设置运行参数hints，以及获取调度参数来配置您的任务。
4. 使用独享调度资源组：如果您的任务需要访问特殊的网络环境，建议使用独享调度资源组，并确保网络连通性以满足特定的网络需求。
5. 安装pyodps：您可能需要安装pyodps包，以便使用PyODPS的相关功能。可以通过pip install pyodps来进行安装。
6. 注意版本兼容性：目前DataWorks中使用的PyODPS版本是2.7，可能会存在一些兼容性问题，如乱序或乱码等。在使用Pandas时需要注意这些问题，并根据实际情况进行调整。
2024-03-04 14:45:14

赞同 1 展开评论
芯在这

方法一：如果您的是source文件，没有压缩，您可以参考下面文档：https://help.aliyun.com/document_detail/94159.html
方法二：在odps使用自定义函数及Python第三方库 https://help.aliyun.com/document_detail/90716.html ，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2024-03-04 10:08:20

赞同展开评论

问答分类：

Python 大数据开发治理平台 DataWorks

问答标签：

Python库 Python Pandas Pandas库 Python pandas库 python3 Pandas

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

使用MaxCompute Python SDK（PyODPS）时to_pandas 就不是集群模式?

306

1

0

使用datawork运行pyspark脚本，其中的python第三方库需要怎么导入？

623

13

0

大数据计算MaxCompute如何在datawork上弄python3的pandas 库？

337

4

0

怎么在datawork上安装Python第三方来源包？

481

3

0

DataWork中如何安装Python包？

428

1

0

在datawork写的python发送邮件，Foxmail可以收到邮件但是收不到附件，我把pytho

431

1

0

datawork里面写python脚本，最后输出excel到本地，写的本地文件路径，但是最后没写成功

326

1

0

那位大侠知道python3.6 下安装pandas依赖包的问题？

491

1

0

我想咨询函数计算搭建相关的问题。采用的是PYTHON3.7 的 flask框架。我逐步把依赖库添加

917

1

0

我用最基础的Hello world用例测了一下，发现python的函数执行速度比java快很多【py

1490

2

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

超高频 RFID 在电力野外杆塔、站房设备标识巡检中的落地方案

OMI/Aura 1B 级平均太阳辐照度 V004 (OML1BIRR) 在 GES DISC

选品比价API：电商运营的“数据雷达”

高QPS场景API接口全链路性能调优：从内核参数到业务代码的三大核心方向

热门讨论

热门文章

在DataWorks上使用PyODPS使用限制是什么？

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

数据来源：com.alibaba.fastjson.JSONException: syntax er

DataWorks概述API网关是什么？

DateWorks上运行的任务，被kill掉了，日志中能查出来，被谁杀掉了吗？

在智能数据建模中涉及的FML是什么的缩写，什么意思？

数据服务报429请求次数过多咋办呀

Maxcompute分区表支持删除数据吗？

DataWorks当前使用的ram账户能访问oss，点那个文件夹会报错？

展开全部

云上一指禅：大数据产品DataWorks每日问答

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

【全新系列】DataWorks百问百答

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks产品使用合集之如何访问周期任务运维

DataWorks售前咨询

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

展开全部

还有其他疑问?