备案控制台

开发者社区问答正文

Spark的编程模型是什么？

Spark的编程模型是什么？

展开

收起

芯在这 2021-12-07 22:53:23 309 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

1.创建应用程序 SparkContext

2.创建RDD，有两种方式，方式一：输入算子，即读取外部存储创建RDD，Spark与Hadoop完全兼容，所以对Hadoop所支持的文件类型或者数据库类型，Spark同样支持。方式二：从集合创建RDD

3.Transformation 算子，这种变换并不触发提交作业，完成作业中间过程处理。也就是说从一个RDD 转换生成另一个 RDD 的转换操作不是马上执行，需要等到有 Action 操作的时候才会真正触发运算。

4.Action 算子，这类算子会触发 SparkContext 提交 Job 作业。并将数据输出 Spark系统。

5.保存结果

6.关闭应用程序

2021-12-07 22:53:37

赞同展开评论

问答分类：

分布式计算 Spark

问答标签：

apache spark模型 apache spark编程 apache spark编程模型

问答地址：

开发者社区 > 大数据 > 问答

相关问答

大数据计算MaxCompute 用spark的话，怎么保存模型到odps里面呢？

178

1

0

Spark的RDD和DataFrame编程模式如何帮助提升核算效率？

90

1

0

Spark相比MapReduce在编程友好性上有哪些优势？

93

1

0

EMR on ACK的spark组件是否支持编程访问日志服务和VPC内的Redis和MongoDB

106

1

0

storm&spark2中使用error模型抛异常时默认情况使用什么方式呢？

1241

1

0

storm&spark2中error模型是如何进行操作的呢？

1263

1

0

Spark的计算模型是什么？

315

1

0

Maxcompute产品架构的计算模型数据通道Spark的作用是什么？

886

1

0

Spark SQL编程流程是什么？

393

1

0

Flink 和 Spark Streaming 在架构模型上有什么区别呢？

376

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云服务器双十一活动多少钱？

通义灵码ide插件2.6.4版本是不是换模型了，现在用的模型是什么？

阿里云双十一优惠活动开始了吗？今年2025年的

阿里云双十一优惠活动开始了？2025年的是这个吗？

无法使用dd.canIUse接口、dd.httpRequest，根本找不到

相关文章

DMS Airflow：企业级数据工作流编排平台的专业实践

阿里云大数据AI产品月刊-2025年10月

一、Scala 基础语法、变量与数据类型

告别繁琐循环：用Java Stream优雅处理集合

别再靠“经验救火”了：用运维数据 + 机器学习，让系统自己告诉你问题在哪

还有其他疑问?