Kafka进阶

简介: 第一,Spark和Storm都是流式处理框架,而Kafka Stream提供的是一个基于Kafka的流式处理类库。框架要求开发者按照特定的方式去开发逻辑部分,供框架调用。开发者很难了解框架的具体运行方式。而Kafka Stream作为流式处理类库,直接提供具体的类给开发者调用,整个应用的运行方式主要由开发者控制,方便使用和调试。

Kafka Stream 的优势


  • 第一,Spark和Storm都是流式处理框架,而Kafka Stream提供的是一个基于Kafka的流式处理类库。框架要求开发者按照特定的方式去开发逻辑部分,供框架调用。开发者很难了解框架的具体运行方式。而Kafka Stream作为流式处理类库,直接提供具体的类给开发者调用,整个应用的运行方式主要由开发者控制,方便使用和调试。
  • 第二,虽然Cloudera与Hortonworks方便了Storm和Spark的部署,但是这些框架的部署仍然相对复杂。而Kafka Stream作为类库,可以非常方便的嵌入应用程序中,它对应用的打包和部署基本没有任何要求。更为重要的是,Kafka Stream充分利用了Kafka的分区机制和Consumer的Rebalance机制,使得Kafka Stream可以非常方便的水平扩展,并且各个实例可以使用不同的部署方式。具体来说,每个运行Kafka Stream的应用程序实例都包含了Kafka Consumer实例,多个同一应用的实例之间并行处理数据集。而不同实例之间的部署方式并不要求一致,比如部分实例可以运行在Web容器中,部分实例可运行在Docker或Kubernetes中。
  • 第三,目前流式处理系统,基本都支持Kafka作为数据源。例如Storm具有专门的kafka-spout,而Spark也提供专门的spark-streaming-kafka模块。事实上,Kafka基本上是主流的流式处理系统的标准数据源。大部分流式系统中都已部署了Kafka,此时使用Kafka Stream的成本非常低。
  • 第四,使用Storm或Spark Streaming时,需要为框架本身的进程预留资源,如Storm的supervisor和Spark on YARN的Node manager。框架本身也会占用部分资源,如Spark Streaming需要为shuffle和storage预留内存。
  • 第五,由于Kafka本身提供数据持久化,因此Kafka Stream提供滚动部署和滚动升级以及重新计算的能力。
  • 第六,由于Kafka Consumer Rebalance机制,Kafka Stream可以在线动态调整并行度。

PPT 分享


相关文章
|
存储 消息中间件 Kafka
kafka入门介绍(转载)
Kafka作为一个分布式的流平台,这到底意味着什么? 我们认为,一个流处理平台具有三个关键能力: 发布和订阅消息(流),在这方面,它类似于一个消息队列或企业消息系统。
1080 0
|
消息中间件 存储 缓存
带你入门Kafka,你知道的越多不知道的也越多!
本文主要介绍 Kafka的入门知识
140 0
|
消息中间件 Kafka Apache
Kafka入门(一)
一,消息队列的分类     1,点对点               消息生产者生产消息发送到queue中,然后消息消费者从queue中取出并且消费消息。                               注意:1,消息被消费以后,queue中不再有存储,所以消息消费者不可能消费到已经被消费的消息。
1173 0
|
存储 消息中间件 监控
|
Web App开发 消息中间件 监控
|
9月前
|
消息中间件 存储 Kafka
KafKa C++实战
KafKa C++实战
541 0
|
消息中间件 存储 负载均衡
Kafka面试题——20道Kafka知识点
7月9日 19:00-21:30 阿里云开发者社区首场“Offer 5000”直播开启!15位团队技术大牛在线招人,更有《阿里云技术面试红宝书》助你拿下Offer!马上投递简历:https://developer.aliyun.com/special/offerday01
|
消息中间件 监控 Java
Kafka笔记
Kafka笔记
106 0
Kafka笔记
|
消息中间件 存储 数据采集
(一)kafka从入门到精通之初识kafka
消费者读取消息,消费者通过检查消息的偏移量来区分已经读取过的消息。消费者是消费者群组的一部分,说也就是说会有一个和多个消费者共同读取一个主题,群组保证每个分区只能被一个消费者使用。
141 0
|
消息中间件 存储 运维
(二)kafka从入门到精通之kafka的优势
咱们这篇内容主要是先来简单的认识一下kafka 的特性,以及常用mq的一些简单对比。
118 1

热门文章

最新文章