文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

Spark与Flink主要区别在哪？

已解决

如题

展开

收起

大侠赵日天 2020-08-06 15:23:49 4795 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

1918339123670743

采纳回答

Spark 和 Flink 的不同执行模型带来的最大的区别应该还是在对流计算的支持上。最开始的 Spark Streaming 对流计算想得过于简单，对复杂一点的计算用起来会有不少问题。从 Spark 2.0 开始引入的 Structured Streaming 重新整理了流计算的语义，支持按事件时间处理和端到端的一致性。虽然在功能上还有不少限制，比之前已经有了长足的进步。不过 micro batch 执行方式带来的问题还是存在，特别在规模上去以后性能问题会比较突出。最近 Spark 受一些应用场景的推动，也开始开发持续执行模式。2.3 里的实验性发布还只支持简单的 map 类的操作。从最近 Spark+AI Summit 大会上的介绍来看（下图），会发展成一个和 Flink 的流处理模式比较相似的执行引擎。 https://www.infoq.cn/article/spark-vs-flink

2020-08-07 17:05:21

赞同展开评论

问答分类：

分布式计算流计算 Spark 云原生大数据计算服务 MaxCompute 实时计算 Flink版

问答标签：

实时计算 Flink版区别 apache spark flink spark实时计算 Flink版 spark实时计算 Flink版区别实时计算 Flink版spark

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

flink里pyspark ,通过 spark-submit 这种方式提交作业，报错依赖缺失咋办？

286

1

0

在Flink CDC中，这两个配置文件有啥区别啊?

211

1

0

serverless spark 和 emr on ack中spark集群类型区别是什么？

244

1

0

dataworks上如何开发实时任务 spark任务或者flink任务？

215

0

0

在Flink CDC中，flinsql读spark表的timestamp类型字段报这个错，这个咋解决

172

0

0

为什么选择从Kafka + Spark Streaming转向Flink？

215

1

0

要在DataWorks上同时使用EMR Spark和Flink应用，应该怎么选择技术架构？

239

0

0

spark任务想完整的部署，发布，执行调度，仅仅maxcompute组件权限够么，还需要datawo

990

1

0

Spark 读取Maxcompute 中的表进行处理，怎么弄？

1060

1

0

maxcompute的底层引擎我用的都是mr，他是可以切换成spark吗？

2072

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347743

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

阿里云数据湖构建DLF完整对接指南：从元数据管理到多引擎集成实践

品牌别名、场景标签和指标聚合：AI回答数据清洗实践

阿里云MaxCompute网站用户访问数据分析从零到实战：完整技术指南

从原始AI回答到品牌推荐率：数据清洗与指标聚合流程

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

请问下大数据计算MaxCompute dataworks是否有全局变量？

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

咨询一下，我配置了MySQL实时同步到MaxCompute的任务，但MySQL数据更新后，MaxCo

大数据计算MaxCompute这个海外版什么时候可以体验到4.0啊?

datetime 类型是大数据计算MaxCompute特有的吗？

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

大数据阿里云产品的简单介绍理解

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

展开全部

还有其他疑问?