MaxCompute产品使用合集之MaxCompute读取外部表的速度较慢，有什么方法来提升读取速度-阿里云开发者社区

MaxCompute产品使用合集之MaxCompute读取外部表的速度较慢，有什么方法来提升读取速度

2024-04-29 318

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： MaxCompute作为一款全面的大数据处理平台，广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践，可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集，涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

问题一：大数据计算MaxCompute文件个数是20个，所以mapper的个数最多是20，只能少不能多么？

大数据计算MaxCompute文件个数是20个，所以mapper的个数最多是20，只能少，不能多么？

参考答案：

odps.stage.mapper.split.size小一点，odps.stage.mapper.mem大一点实时.odps.stage.mapper.split.size 默认就是256，设置成128试下吧

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/570838

问题二：大数据计算MaxCompute读取外部表速度非常慢，有什么方法可以提升效率么？

大数据计算MaxCompute读取外部表（数据在oss gz压缩）速度非常慢，有什么方法可以提升效率么？

参考答案：

那有没有其他的可以筛选的列了，设置个条件，一部分一部分的写入，看一下时间。数据量大的话时间是会多一些

可以把这里的worker调多一些，没办法直接设置数量，可以通过odps.stage.mapper.mem和odps.stage.mapper.split.size间接控制一下，可以参考这个文档配置：https://help.aliyun.com/zh/maxcompute/user-guide/flag-parameters?spm=a2c4g.11186623.0.i50#concept-2278178

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/570837

问题三：大数据计算MaxCompute怎么看项目和工作空间的关联啊？

大数据计算MaxCompute怎么看项目和工作空间的关联啊？

参考答案：

在MaxCompute中，项目和工作空间是密切相关的两个概念。具体来说，项目是MaxCompute的逻辑隔离单位，它包含数据表、函数、资源等相关对象。而工作空间则是在MaxCompute控制台上操作的对象。

如果你想查看某个项目和工作空间之间的关联关系，你可以通过以下几个步骤来实现：

登录MaxCompute控制台，选择你需要查看的项目。
在左侧导航栏中找到“工作空间”，并点击进入。
在工作空间页面中，你可以看到该工作空间下的所有项目。

需要注意的是，每个工作空间都可能包含多个项目，因此一个项目可以在多个工作空间中存在。同时，不同的工作空间之间也是独立的，这意味着你在其中一个工作空间中进行的操作不会影响到其他工作空间中的内容。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/570836

问题四：大数据计算MaxCompute这个海外版什么时候可以体验到4.0啊?

大数据计算MaxCompute这个海外版什么时候可以体验到4.0啊?

这一步有具体的代码或者文档吗?

参考答案：

MaxFrame会在12月份对外邀测，感兴趣的话可以先看一下官网的文档：

https://help.aliyun.com/zh/maxcompute/user-guide/data-science-computing-overview?spm=a2c4g.11186623.0.0.370c4432c4xcVa![859b047ead28ac07f34db97f3e008bc4.png](https://ucc.alicdn.com/pic/developer-ecology/wyvq5mjsckydw_ee2dbfd7dc644e98a397c110c46534e0.png)

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/570834

问题五：请问下大数据计算MaxCompute dataworks是否有全局变量？

请问下大数据计算MaxCompute dataworks是否有全局变量，比如我设置today是今天的日期，在每个sql节点里直接调用这个变量就可以，而不需要每个节点都要在调度配置里一个个配呢？

参考答案：

看下流程参数，开发环境需要匹配一下参数值，才能运行。生产环境会根据你的配置默认执行

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/570832

MaxCompute产品使用合集之MaxCompute读取外部表的速度较慢，有什么方法来提升读取速度

问题一：大数据计算MaxCompute文件个数是20个，所以mapper的个数最多是20，只能少不能多么？