文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

Spark与Flink主要区别在哪？

已解决

如题

展开

收起

大侠赵日天 2020-08-06 15:23:49 4791 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

1918339123670743

采纳回答

Spark 和 Flink 的不同执行模型带来的最大的区别应该还是在对流计算的支持上。最开始的 Spark Streaming 对流计算想得过于简单，对复杂一点的计算用起来会有不少问题。从 Spark 2.0 开始引入的 Structured Streaming 重新整理了流计算的语义，支持按事件时间处理和端到端的一致性。虽然在功能上还有不少限制，比之前已经有了长足的进步。不过 micro batch 执行方式带来的问题还是存在，特别在规模上去以后性能问题会比较突出。最近 Spark 受一些应用场景的推动，也开始开发持续执行模式。2.3 里的实验性发布还只支持简单的 map 类的操作。从最近 Spark+AI Summit 大会上的介绍来看（下图），会发展成一个和 Flink 的流处理模式比较相似的执行引擎。 https://www.infoq.cn/article/spark-vs-flink

2020-08-07 17:05:21

赞同展开评论

问答分类：

分布式计算流计算 Spark 云原生大数据计算服务 MaxCompute 实时计算 Flink版

问答标签：

实时计算 Flink版区别 apache spark flink spark实时计算 Flink版 spark实时计算 Flink版区别实时计算 Flink版spark

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

flink里pyspark ,通过 spark-submit 这种方式提交作业，报错依赖缺失咋办？

279

1

0

Flink这两种有什么区别吗？

182

1

0

在Flink CDC中，这两个配置文件有啥区别啊?

206

1

0

serverless spark 和 emr on ack中spark集群类型区别是什么？

236

1

0

dataworks上如何开发实时任务 spark任务或者flink任务？

210

0

0

在Flink CDC中，flinsql读spark表的timestamp类型字段报这个错，这个咋解决

163

0

0

为什么选择从Kafka + Spark Streaming转向Flink？

204

1

0

要在DataWorks上同时使用EMR Spark和Flink应用，应该怎么选择技术架构？

234

0

0

spark任务想完整的部署，发布，执行调度，仅仅maxcompute组件权限够么，还需要datawo

986

1

0

Spark 读取Maxcompute 中的表进行处理，怎么弄？

1051

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347743

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

Spark SQL 函数分类导航

AI核心概念探索

多Agent集群中的"情报官"设计：为什么系统需要一个RDD

阿里云 PAI-DLC PyTorchJob 任务提交参数的介绍

阿里云云原生数据仓库 AnalyticDB PostgreSQL 版对接使用全攻略

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

咨询一下，我配置了MySQL实时同步到MaxCompute的任务，但MySQL数据更新后，MaxCo

datetime 类型是大数据计算MaxCompute特有的吗？

大数据计算MaxCompute作业运维排序报错，如何解决？

展开全部

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

MaxCompute上如何处理非结构化数据

倒计时1天！相约杭州云栖，相遇数据智能

iphoneX都面世了，你的数据仓库还停留在诺基亚时代吗?

3天撸完一个团队半年的项目，单客户数据动辄几百万的行业也玩云？

标签分类理论

SLS：海量日志数据管理利器

获取大数据计算通关秘籍，拥有全新一代计算引擎免费试用权益

MaxCompute 项目子账号做权限管理

“阿里巴巴大数据系统体系”学习笔记-纲领篇

展开全部

还有其他疑问?