文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

请问大数据计算MaxCompute dw上的python3使用的是哪个资源组的资源?

请问大数据计算MaxCompute dw上的python3使用的是哪个资源组的资源? 假如我es没有有3000w数据需要做分词, 我看这个案例不推荐使用python一条条处理,会oom, 推荐使用mc分布式, 是怎么实现的?写完代码打成utf包在sql里使用吗?https://developer.aliyun.com/article/745029?spm=a2c4g.11186623.0.0.46c4aae3AD0StM

展开

收起

真的很搞笑 2024-01-16 13:21:05 165 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks中，Python3任务使用的是MaxCompute的计算资源组。如果您的任务需要处理大量数据，建议使用分布式计算方式，如MaxCompute的MC（MaxCompute Distributed）服务。

MC服务可以将任务拆分成多个子任务，并在多个节点上并行执行。这样可以避免单个任务处理大量数据时出现内存溢出（OOM）的问题。MC服务支持多种编程语言，包括Python3。

要将代码打包成UTF包并在SQL中使用，您可以按照以下步骤操作：
1. 将您的Python代码打包成一个ZIP文件。
2. 将ZIP文件上传到MaxCompute的OSS（对象存储服务）。
3. 在DataWorks中创建一个Python3任务，并将OSS中的ZIP文件作为代码包引入。
4. 编写SQL语句，调用Python3任务中的函数或方法来处理数据。
具体实现可以参考官方文档：https://help.aliyun.com/document_detail/745029?spm=a2c4g.11186623.0.0.46c4aae3AD0StM
2024-01-16 14:13:18

赞同展开评论
芯在这

PyODPS Python类的开发目前是用的DW的资源，如果要用MC的资源可以封装Python UDF ，此回答整理自钉群“MaxCompute开发者社区2群”

2024-01-16 13:55:25

赞同展开评论

问答分类：

Python 分布式计算 MaxCompute 大数据自然语言处理 SQL 云原生大数据计算服务 MaxCompute

问答标签：

Python资源云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute资源云原生大数据计算服务 MaxCompute python

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

在大数据计算MaxCompute中，MaxFrame调用的时候怎么指定资源组？

249

1

0

在大数据计算MaxCompute中，怎么选择用到的资源组？

247

1

0

在大数据计算MaxCompute中MaxCompute资源DataWorks资源组这两个分别在哪看?

236

2

0

在pyodps执行大数据计算MaxCompute的demo用公共资源组报错，咋用啊？

228

1

0

大数据计算MaxCompute的计算任务的速度主要受什么钳制啊？购买独享调度资源组能提升计算速度吗？

240

1

0

我用最基础的Hello world用例测了一下，发现python的函数执行速度比java快很多【py

1491

2

0

请问Python写的函数可以在中台调用吗? 数据中台为什么不支持pandas包?

1245

1

0

函数运行 /opt/python/scrapy crawl pubs 提示没有权限怎么办呢？直接使用

1265

1

0

请问我的一个python脚本想直接在函数计算中跑，这个脚本是一直运行的状态，但创建函数我看到都有执行

1303

1

0

Fc 函数能在构建环境的时候预装指定的 linux 包么，python sdk调用需要依赖

1576

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

AI大模型工具深度运用实践：AI客服系统怎么搭建？基于大语言模型的企业智能客服实践与应用分析

某企业 APP 自动化测试 POC：AI 智能体能否真正完成测试执行闭环？

跨境履约智能化落地实践：基于三维遍历算法的 Taocarts 智能合箱技术解析

国产之光！阿里千问上线 Image3：4500长Token输入！

2026企业如何应用BI系统？数字化转型必读攻略

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

MaxCompute这个yaml资源在生产环境中无法找到,什么原因？

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

删除，和变动的数据，hive分区要怎么处理呢？

大数据计算MaxCompute failed：odps-0110999怎么办？

在大数据计算MaxCompute怎么将字符串日期快速转成timestamp类型？

大数据计算MaxCompute有没有SQL可以列出项目下已有的外表呢？

在大数据计算MaxCompute中，有没有for循环类似的函数？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

品《阿里巴巴大数据实践-大数据之路》一书（上）

展开全部

还有其他疑问?