文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

在MaxCompute中想在udf中使用pandas,该怎样操作呢？

问题1：在MaxCompute中想在udf中使用pandas,该怎样操作呢？问题2：pandas的流程和numpy一样吗？

展开

收起

三分钟热度的鱼 2023-06-20 09:45:39 208 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

针对问题1的回答：python udf使用第三方包，可以参考一下这个文档，需要把使用到的包都传到MaxCompute资源上。 https://help.aliyun.com/document_detail/189752.html?spm=a2c4g.73777.0.i6#section-fvb-vln-9z0

如果相关的包很多的话，可以看一下PyODPS制作第三方包这个方法，可以本地把相关的包打成一个包使用 https://help.aliyun.com/document_detail/2248600.html?spm=a2c4g.90688.0.0.230963d0phsOP9 针对问题2的回答：一样，把需要用到的pandas包上传到MaxCompute里再用。此回答整理自钉群“MaxCompute开发者社区2群”

2023-06-20 09:47:19

赞同展开评论

问答分类：

分布式计算 MaxCompute Python 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute pandas maxcompute Pandas 云原生大数据计算服务 MaxCompute udf 云原生大数据计算服务 MaxCompute操作 Pandas操作

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

在大数据计算MaxCompute中如果通过udf去访问高德api，参数配置页签的外部网络中如何配置？

362

1

0

怎么将pandas dataframe数据写入odps数据表？

290

0

0

大数据计算MaxCompute中dataframe怎么转成pandas的dataframe？

228

1

0

使用MaxCompute Python SDK（PyODPS）时to_pandas 就不是集群模式?

317

1

0

dataworks的同步支持提前在maxcompute上把对应的数据算出来，如果支持应该如何操作？

164

1

0

大数据计算MaxCompute在udf 开发过程中如何获取到访问凭证呢？

235

1

0

大数据计算MaxCompute的to_pandas()方法默认有数据限制，这个有解决方法吗？

167

1

0

大数据计算MaxCompute的Python UDF使用第三方包，有可视化操作的方式吗？

135

1

0

DataWorks这个白名单一直在变，我该怎么操作，我想把maxcompute的数据导入到rds？

209

2

0

DataWorks数据在oss，我在maxcompute中创建外部表这样操作数据源一直在oss对吧？

216

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

Benchmarks Game — Nolang vs C vs Rust 性能對比報告

基于YOLOv8的钢材表面缺陷检测系统

甲醛 (HCHO) 总柱扫描轨道

沿云压和云量 CloudSat V003 轨道

高精度IP地址定位查询结果可靠吗？三步验证方法+工具推荐

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

MaxCompute这个yaml资源在生产环境中无法找到,什么原因？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

大数据计算MaxCompute failed：odps-0110999怎么办？

dataworks 如何导出maxcomputer的数据为文本？

删除，和变动的数据，hive分区要怎么处理呢？

请问下在maxcompute中建立视图，如何查看建表语句，如何加注释？

在大数据计算MaxCompute中，有没有for循环类似的函数？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

Python+大数据计算平台，PyODPS架构手把手教你搭建

品《阿里巴巴大数据实践-大数据之路》一书（上）

干货：解码OneData，阿里的数仓之路。

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

MaxCompute常见错误汇总（更新ing）

品《阿里巴巴大数据实践-大数据之路》一书(下)

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

展开全部

还有其他疑问?