文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

您好，Dataworks我们用到pyodps3里调用算法，必须使用原生DataFrame怎么办，？

您好，Dataworks我们用到pyodps3里调用算法，必须使用原生DataFrame怎么办，下载数据会很慢，而且容易OOM，用阿里得DataFrame不兼容算法？

展开

收起

真的很搞笑 2023-07-12 08:27:07 217 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

阿里云 DataWorks 中，如果您需要使用 PyODPS3 调用算法，同时需要使用原生 DataFrame，可以通过以下方法实现：
将 PyODPS3 中的 DataFrame 转换为原生 DataFrame：可以使用 PyODPS3 中的 to_pandas() 方法，将 PyODPS3 中的 DataFrame 对象转换为 Pandas 中的 DataFrame 对象，然后再将 Pandas 中的 DataFrame 对象转换为原生 DataFrame。
具体而言，可以使用如下代码实现：
python
Copy
import pandas as pd
from odps.df import DataFrame

使用 PyODPS3 获取 DataFrame 对象

odps_df = DataFrame(...)

将 PyODPS3 中的 DataFrame 转换为 Pandas 中的 DataFrame

pandas_df = odps_df.to_pandas()

将 Pandas 中的 DataFrame 转换为原生 DataFrame

native_df = pandas_df.values.tolist()
需要注意的是，将 PyODPS3 中的 DataFrame 转换为 Pandas 中的 DataFrame 可能会导致性能损失和内存消耗，因此建议在数据量较小的情况下使用。
直接使用 PyODPS3 中的 DataFrame：如果您的算法可以直接使用 PyODPS3 中的 DataFrame，可以直接使用 PyODPS3 中的 DataFrame 进行算法计

2023-07-30 20:17:23

赞同展开评论
芯在这

在群公告可以找到，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-07-12 10:00:51

赞同展开评论

问答分类：

DataWorks 算法大数据开发治理平台 DataWorks

问答标签：

dataworks算法大数据开发治理平台 DataWorks算法大数据开发治理平台 DataWorks原生算法dataworks 大数据开发治理平台 DataWorks pyodps3

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks的PyODPS3节点访问MaxCompute中的Hologres外部表报错a...

180

1

0

dataworks从mongo抽取到odps 只能通过写datax的原生json抽取吗？

160

1

0

DataWorks这个算法的工作空间我想绑定到之前的工作空间这个要怎么绑？

129

1

0

DataWorks通过 pyodps3 把数据推送到钉钉有条数限制吗？

106

1

0

DataWorks中ODPS的加密函数有AES算法+ECB加密模式的组合吗？

207

0

0

DataWorks业务流程找不到算法机器学习PAI入口

99

0

0

DataWorks中pyodps3在生产空间无法访问外网是哪里要设置吗？

147

1

0

要用java写个算法，能放到dataWorks里执行吗？

142

2

0

dataworks 的算法节点有说明文档嘛，可以写python模型脚本嘛？

174

1

0

DataWorks在资源中上传了第三方Python包，如何在pyodps3中使用第三方包？

169

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

征信生成器，数值计算与报告生成Oberon

密码md5转为明文密码，逆向转换Wren实现

农业银行app余额生成器，农业数值Haxe引擎

微信模拟生成器下载，模拟生成Gleam工具库

算法对齐还是实战突围？解构GEO优化中方法论与实践的权重博弈

热门讨论

热门文章

数据来源：com.alibaba.fastjson.JSONException: syntax er

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

DataWorks OpenAPI计费方式是什么？

数据服务报429请求次数过多咋办呀

DataWorks中api调用次数达到上限，怎么调整？

DataWorks中78xxxxx_out的输出是什么?

DataWorks概述API网关是什么？

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

在DataWorks中为什么运维中心还显示它有一个直接下游依赖？

DataWorks中python调用dataworks api 怎么查看endpoint？

展开全部

拒绝“数据断层”：高质量舆情分析背后的隐形功臣——动态节点池

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks售前咨询

云上一指禅：大数据产品DataWorks每日问答

语雀+通义千问+DataWorks，让AI定期推送每周总结

DataWorks智能交互式数据开发与分析之旅

DataWorks操作报错合集之连接数据库时出现了通信链接失败的报错，该如何解决

【赵渝强老师】阿里云大数据集成开发平台DataWorks

展开全部

还有其他疑问?