开发者社区> 问答> 正文

Spark Streaming和Storm有何区别?

Spark Streaming和Storm有何区别?

展开
收起
茶什i 2019-10-29 14:30:57 2419 0
3 条回答
写回答
取消 提交回答
  • Spark Streaming和Storm都是将流数据分成一个个小块的批数据(batch)。

    处理模型、延迟 Strom:处理的是每次传入的事件。秒内延迟。(最小100ms) Spark Streaming:处理的是某个时间段窗口内的事件流。秒级延迟。(0.5~2s)

    容错、数据保证 Strom:每个单独的记录都会被跟踪。恢复时,意味着状态可能被错误滴更新两次。 Spark Streaming:只是在批处理级别进行跟踪。

    适用场景 Strom:实时性要求高,毫秒级延迟,不需要有状态计算。 Spark Streaming:秒级延迟,比Strom吞吐量大,需要有状态计算

    2020-03-19 19:23:09
    赞同 展开评论 打赏
  • SparkStreaming的吞吐量非常高,秒级准实时处理,Storm是容错性非常高,毫秒级实时处理 具体来说:sparkStreaming是一次处理某个间隔的数据,比如5秒内的数据,批量处理,所以吞吐量高。Storm是来一条处理一条,所以速度快,不存在丢失数据。

    应用场景:对于数据非常重要不能丢失数据的,不能有延迟的,比如股票,金融之类场景的使用Storm。对于没那么高精度,但是要处理大量的数据,可以用sparkSremaing。

    2019-10-30 21:24:22
    赞同 展开评论 打赏
  • 一个实时毫秒一个准实时亚秒,不过storm的吞吐率比较低。

    2019-10-30 15:37:08
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载