Flink 相比传统的 Spark Streaming 有怎样的区别?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

Flink 相比传统的 Spark Streaming 有怎样的区别?

2021-12-08 17:05:05 387 1

Flink 相比传统的 Spark Streaming 有怎样的区别?

取消 提交回答
全部回答(1)
  • 游客atyyogx5esqqy
    2021-12-08 17:06:21

    :Flink 是标准的实时处理引擎,基于事件驱动。而 Spark Streaming 是微批(Micro-Batch)的模型。

    1. 架构模型

    Spark Streaming 在运行时的主要角色包括:Master、Worker、Driver、Executor,Flink 在运行时主要包含:Jobmanager、Taskmanager和Slot。

    1. 任务调度

    Spark Streaming 连续不断的生成微小的数据批次,构建有向无环图DAG,Spark Streaming 会依次创建 DStreamGraph、JobGenerator、JobScheduler。

    Flink 根据用户提交的代码生成 StreamGraph,经过优化生成 JobGraph,然后提交给 JobManager进行处理,JobManager 会根据 JobGraph 生成 ExecutionGraph,ExecutionGraph 是 Flink 调度最核心的数据结构,JobManager 根据 ExecutionGraph 对 Job 进行调度。

    1. 时间机制

    Spark Streaming 支持的时间机制有限,只支持处理时间。 Flink 支持了流处理程序在时间上的三个定义:处理时间、事件时间、注入时间。同时也支持 watermark 机制来处理滞后数据。

    1. 容错机制

    对于 Spark Streaming 任务,我们可以设置 checkpoint,然后假如发生故障并重启,我们可以从上次 checkpoint 之处恢复,但是这个行为只能使得数据不丢失,可能会重复处理,不能做到恰好一次处理语义。

    Flink 则使用两阶段提交协议来解决这个问题。

    0 0
相关问答

1

回答

代码中如何取消正在运行的Flink Streaming作业

2021-12-07 15:39:46 445浏览量 回答数 1

1

回答

代码中如何取消正在运行的Flink Streaming作业

2021-12-06 15:33:55 524浏览量 回答数 1

1

回答

Flink CDC中的CDC是什么意思?

2022-01-19 15:15:09 4569浏览量 回答数 1

1

回答

Flink CDC 的下游支持了哪些数据源?

2022-01-19 16:09:35 766浏览量 回答数 1

1

回答

有关 Flink CDC 的介绍和教程可以在哪里参考到?

2022-01-19 16:35:16 1539浏览量 回答数 1

1

回答

Flink CDC 的核心特性有哪些?

2022-01-19 16:17:42 601浏览量 回答数 1

1

回答

Flink CDC 的亮点之一是什么?

2022-01-19 16:21:12 608浏览量 回答数 1

1

回答

Flink CDC 和 Flink 的版本对应关系是怎么样的?

2022-01-19 16:25:14 1278浏览量 回答数 1

1

回答

flink 1.11 cdc相关问题

2021-12-07 10:07:48 701浏览量 回答数 1

1

回答

Flink1.11支持CDC了是么? #Flink

2020-06-10 23:24:45 1720浏览量 回答数 1
文章
问答
问答排行榜
最热
最新
相关电子书
更多
基于HBase和Spark构建企业级数据处理平台
立即下载
基于streaming构建统一的数据处理引擎的挑战与实践
立即下载
# Apache Spark系列技术直播# 第五讲【 Spark RDD编程入门 】
立即下载