文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

如何在datawork上弄python3的pandas 库？

如何在datawork上弄python3的pandas 库？

展开

收起

真的很搞笑 2024-03-04 08:42:06 304 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks上使用Python 3的Pandas库，您需要通过PyODPS节点来实现。以下是具体的步骤：
1. 创建PyODPS 3节点：您需要在DataWorks的数据开发页面创建一个PyODPS 3节点，因为PyODPS 3节点底层支持Python 3语言版本。
2. 编写MaxCompute作业：在创建好的PyODPS 3节点中，您可以直接使用Python代码编写MaxCompute作业。PyODPS提供了DataFrame接口来处理MaxCompute对象，并且可以转换成Pandas进行数据操作。
3. 配置调度参数：在开发PyODPS任务代码时，您可以设置运行参数hints，以及获取调度参数来配置您的任务。
4. 使用独享调度资源组：如果您的任务需要访问特殊的网络环境，建议使用独享调度资源组，并确保网络连通性以满足特定的网络需求。
5. 安装pyodps：您可能需要安装pyodps包，以便使用PyODPS的相关功能。可以通过pip install pyodps来进行安装。
6. 注意版本兼容性：目前DataWorks中使用的PyODPS版本是2.7，可能会存在一些兼容性问题，如乱序或乱码等。在使用Pandas时需要注意这些问题，并根据实际情况进行调整。
2024-03-04 14:45:14

赞同 1 展开评论
芯在这

方法一：如果您的是source文件，没有压缩，您可以参考下面文档：https://help.aliyun.com/document_detail/94159.html
方法二：在odps使用自定义函数及Python第三方库 https://help.aliyun.com/document_detail/90716.html ，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2024-03-04 10:08:20

赞同展开评论

问答分类：

Python 大数据开发治理平台 DataWorks

问答标签：

Python库 Python Pandas Pandas库 Python pandas库 python3 Pandas

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

使用MaxCompute Python SDK（PyODPS）时to_pandas 就不是集群模式?

315

1

0

使用datawork运行pyspark脚本，其中的python第三方库需要怎么导入？

629

13

0

大数据计算MaxCompute如何在datawork上弄python3的pandas 库？

345

4

0

怎么在datawork上安装Python第三方来源包？

492

3

0

DataWork中如何安装Python包？

435

1

0

在datawork写的python发送邮件，Foxmail可以收到邮件但是收不到附件，我把pytho

435

1

0

datawork里面写python脚本，最后输出excel到本地，写的本地文件路径，但是最后没写成功

338

1

0

那位大侠知道python3.6 下安装pandas依赖包的问题？

496

1

0

我想咨询函数计算搭建相关的问题。采用的是PYTHON3.7 的 flask框架。我逐步把依赖库添加

923

1

0

pandas中从SQL表/库导入数据的方法是什么？

638

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

函数计算冷启动时间过长怎么办？阿里云：依赖精简与预留实例优化指南

Python的异步把我坑惨了，原来async/await和多线程的区别这么大

用Python完成网站SEO与GEO基础巡检：检查Sitemap、Canonical和JSON-LD

跨境履约智能化落地实践：基于三维遍历算法的 Taocarts 智能合箱技术解析

GES DISC 的 OMPS/NPP L1B NP 辐射 EV 校准地理定位条带轨道 V2 (OMPS_NPP_NPEV_L1B)

热门讨论

热门文章

在DataWorks上使用PyODPS使用限制是什么？

DataWorks假设我要在PyODPS中查询test中的表，我应该怎么写语句？

数据来源：com.alibaba.fastjson.JSONException: syntax er

数据服务报429请求次数过多咋办呀

DataWorks在哪里查看当前购买的是什么版本呢？

配置同步任务中的数据... ID=jCvVPH4B1r73GMJAKlKV INDEX=0

有使用dataworks结合MDM进行主数据项目实施的吗？

请问大家，天ds，小时hh，周和月分区是如何命名的？

DataWorks概述API网关是什么？

请问一下，odps有函数支持分组内排序后取组内第几条数值的吗？比如一个课程有6节课，我要取第3节课

展开全部

DataWorks AI助理：一句话，帮你搞定研发周报！

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

DataWorks数据源问题之数据集成任务报错如何解决

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

长文详解｜DataWorks Data+AI一体化开发实战图谱

基于DataWorks搭建新零售数据中台

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

语雀+通义千问+DataWorks，让AI定期推送每周总结

展开全部

还有其他疑问?