阿里云MaxCompute上,我使用pyodps连接云上数据库后(get_table.to_df()),想计算一下auc(使用sklearn中的roc_auc_score计算),但是数据量太大,老是把服务器内存撑爆(很奇怪为啥没在云上计算,而是占用服务器大量内存)
主要计算代码:
from opds import DataFrame
a_df = DataFrame(odps.get_table('temp_tb'))
roc_auc_score(y_ture = a_df.label,y_score = a_df.score)
这样计算是在本地计算的嘛?否则内存应该占用不多吧?不太懂,应该如何处理呢,求大佬教
直接在云上计算,不占用大量本地内存
看着是运行到了本地,导致本地内存爆了。
你可以参考这篇文章改一下。
https://developer.aliyun.com/article/782779
我理解用udf或者用Python第三方库才能解决你的问题。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。