备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

请问大数据计算MaxCompute dw上的python3使用的是哪个资源组的资源?

请问大数据计算MaxCompute dw上的python3使用的是哪个资源组的资源? 假如我es没有有3000w数据需要做分词, 我看这个案例不推荐使用python一条条处理,会oom, 推荐使用mc分布式, 是怎么实现的?写完代码打成utf包在sql里使用吗?https://developer.aliyun.com/article/745029?spm=a2c4g.11186623.0.0.46c4aae3AD0StM

展开

收起

真的很搞笑 2024-01-16 13:21:05 94 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks中，Python3任务使用的是MaxCompute的计算资源组。如果您的任务需要处理大量数据，建议使用分布式计算方式，如MaxCompute的MC（MaxCompute Distributed）服务。

MC服务可以将任务拆分成多个子任务，并在多个节点上并行执行。这样可以避免单个任务处理大量数据时出现内存溢出（OOM）的问题。MC服务支持多种编程语言，包括Python3。

要将代码打包成UTF包并在SQL中使用，您可以按照以下步骤操作：
1. 将您的Python代码打包成一个ZIP文件。
2. 将ZIP文件上传到MaxCompute的OSS（对象存储服务）。
3. 在DataWorks中创建一个Python3任务，并将OSS中的ZIP文件作为代码包引入。
4. 编写SQL语句，调用Python3任务中的函数或方法来处理数据。
具体实现可以参考官方文档：https://help.aliyun.com/document_detail/745029?spm=a2c4g.11186623.0.0.46c4aae3AD0StM
2024-01-16 14:13:18

赞同展开评论
芯在这

PyODPS Python类的开发目前是用的DW的资源，如果要用MC的资源可以封装Python UDF ，此回答整理自钉群“MaxCompute开发者社区2群”

2024-01-16 13:55:25

赞同展开评论

问答分类：

Python 分布式计算 MaxCompute 大数据自然语言处理 SQL 云原生大数据计算服务 MaxCompute

问答标签：

Python资源云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute资源云原生大数据计算服务 MaxCompute python

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

大数据计算MaxCompute中python有没有像java一样的，直接.size获取分区数？

158

2

0

在大数据计算MaxCompute中，为什么一直启动不起来，一直在等待资源？

137

1

0

Python ODPS 建OSS外表怎么操作？

216

1

0

如何使用Python获取MaxCompute项目中的所有表名？

89

0

0

大数据计算MaxCompute有使用python在dataworks里面访问holo的例子吗？

156

1

0

如何使用Python调用MaxCompute上的数据?

398

7

0

如何在Python中获取MaxCompute表的字段名称？

97

0

0

大数据计算MaxCompute的python怎么导入第三方包？

192

2

0

大数据计算MaxCompute写了 python脚本后在pyodps3里面运行，报错怎么解决？

130

1

0

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

1160

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

十、HQL：排序、联合与 CTE 高级查询

Python异步编程入门：告别阻塞，拥抱高效IO

十一、Hive JOIN 连接查询

小白必看：AI智能体零基础搭建全攻略！

linux命令

热门讨论

热门文章

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

Dataworks中MaxCompute表怎么创建唯一索引啊?

请问大数据计算MaxCompute中有没有类似mysql中这样的设置事务级别的变量的方法？

大数据计算MaxCompute 目前不支持其他格式的csv文件吗？

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute我这边想更改字段长度报错了？

DataWorks数据存储在maxcompute 表格式可以压缩吗可以设置存储副本数吗？

大数据计算MaxCompute的Maxframe有什么官方的权限文档能参考么？

大数据计算MaxCompute的机器学习深度学习上gpu服务器资源怎么使用和配置？

大数据计算MaxCompute的group by 时合并array , 用什么方法？

展开全部

【转载】时隔一年多，我又用起了 Superset

品《阿里巴巴大数据实践-大数据之路》一书（上）

干货：解码OneData，阿里的数仓之路。

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

阿里云机器学习平台的思考

【逐云】阿里“水电煤”背后的人物故事

企业大数据平台下数仓建设思路

MaxCompute上如何处理非结构化数据

美柚与MaxCompute数据同步架构说明

Amazon Redshift数据迁移到MaxCompute

展开全部

还有其他疑问?