备案控制台

开发者社区> 问答> 正文

Spark on MaxCompute在Spark客户端提交作业时与开源模式的区别是啥？

Spark on MaxCompute在Spark客户端提交作业时与开源模式的区别是啥？

展开

收起

bnbajjyhyjfty 2021-12-11 17:08:38 1065 0

1 条回答

写回答

取消提交回答

游客5q6u2bzdfcir4

首先，使用Spark on MaxCompute的客户端做MaxCompute表时，代码中计划访问MaxCompute表，拉取RDD数据进行分析。随即在本地测试时将MaxCompute表里的数据下载下来，再进行处理。此时如果MaxCompute表较大的话，拉取数据的时间会比较长，导致作业运行的时间也会变长。其次，在测试时UDF会拉张表写到本地的Warehouse目录下，在下次测试使用缓存数据。但Spark on MaxCompute本地测试时，都需要重新拉数据。所以针对这个特性做功能测试时，在拉的取的表中选定一部分特征，或者选一些分区下载，使得数据量变少，避免将所有数据都下载再运行作业。此外，在Client的模式下，正常开源模式中提交时客户端Driver需要启动，而Spark on MaxCompute在Client模式下运行时，客户端不用启Driver

2021-12-11 17:12:43

赞同展开评论打赏

问答分类：

分布式计算 MaxCompute Spark 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute模式云原生大数据计算服务 MaxCompute作业 apache spark MaxCompute 云原生大数据计算服务 MaxCompute spark apache spark客户端

问答地址：

开发者社区 > 大数据 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

MaxCompute从按量计费变为包年包月计费模式时是否会引起数据变化或服务重启

9

1

0

MaxCompute按量计费模式如何停用自动续费功能

12

1

0

MaxCompute脚本模式为什么不支持两个create table语句

16

1

0

大数据计算MaxCompute Spark可以支持yarn client模式吗？

32

1

0

大数据计算MaxCompute按量付费模式下，执行sql任务，有的task启动早，有的启动晚

17

0

0

大数据计算MaxCompute脚本模式使用if判断可以做到吗?

27

1

0

MaxCompute中主账号修改hive兼容模式失败these commands can no...

11

0

0

大数据计算MaxCompute的ODPS的加密函数有AES算法+ECB加密模式的组合吗？

4

1

0

DataWorks中ODPS的加密函数有AES算法+ECB加密模式的组合吗？

8

0

0

大数据计算MaxCompute用直读模式读holo外表的话，会不会对holo造成什么压力？

14

1

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699889

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818314

3 据说在家办公的程序员是这样写代码的？ 1792338

4 阿里云开放端口权限 689923

5 如何升级配置 536074

6 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522460

7 【精品问答】python技术1000问(1) 514001

8 Flink Forward Asia 2021 有奖问答 512807

9 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456921

10 OceanBase 使用动画（持续更新） 359266

11 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329722

12 OSS存储服务-客户端工具 321336

13 为体验实验室取一个新名字。 307317

14 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303858

15 Win Server 2003-2016 加密勒索事件必打补丁合集 295162

16 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283657

17 安全组详解，新手必看教程 277260

18 写code还是做管理，开发者如何进行职业规划？ 268469

19 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255828

20 阿里云手机和阿云浏览器连接问题专帖 235631

1 国内AI大模型高考数学成绩超GPT-4o，如何看待这一结果？ 511

2 如何避免“写代码5分钟，调试2小时”的尴尬？ 430

3 通义灵码生成Git Commit的时候，偶尔生成中文，偶尔生成英文，根本无法控制生成的语言。 107

4 一键部署3D卡通风格模型，分享部署过程及使用体验 504

5 展示你通过AI修饰的自然风光照片，并讲述你的拍摄和编辑过程 884

6 机器学习PAI现在一直在重试，怎样停掉？ 213

7 请问机器学习PAI eas服务拉取dockerhub失败怎么办？ 169

8 请教下机器学习PAI的代码配置没有链接测试吗？ 100

9 平头哥芯片W800:芯片如何购买？ 137

10 阿里云Grafana升级10后已有的飞书webhook 报警机器人不再工作。请问如何排查？ 145

11 请问通义灵码IDEA生成Git Commit Message 如何默认生成中文注释 100

12 Nacos登录密码忘记了如何修改？ 250

13 你知道APP是怎么开发的吗？ 1478

14 如何提高企业的业务稳定性？ 619

15 钉钉宜搭，A提交一个表单，如何设置该表单只能给B看？ 138

16 百问求答 | 回答问题即有机会得米家落地扇 326

17 集成&自动化：3层触发时，新增和删除触发正常，但编辑时不正常 107

18 分享AI代码助手的使用体验 756

19 分享一张AI生成的“老照片”，讲讲你与它的故事 999

20 idea上的通义灵码生成git提交消息老是会变成英文没有切换中文的入口 268

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

276

28

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

118

25

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

146

32

去学习

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

198

21

去学习

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

342

9

去学习

大数据实时计算框架Spark快速入门

955

93

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

Hybrid Cloud and Apache Spark 立即下载

Scalable Deep Learning on Spark 立即下载

Comparison of Spark SQL with Hive 立即下载

相关实验场景

更多