开发者社区> 问答> 正文

Spark基于receiver的方式获取Kafka数据有什么缺点?

Spark基于receiver的方式获取Kafka数据有什么缺点?

展开
收起
游客fq2cv4o24bhvc 2021-12-07 17:33:46 426 0
1 条回答
写回答
取消 提交回答
  • 1、导致丢失数据。它是由Executor内的Receive来拉取数据并存放在内存中,再由Driver端提交的job来处理数据。这样的话,如果底层节点出现错误,就会发生数据丢失。

    2、浪费资源。

    3、可能会导致重复读取数据。由Zookeeper来记录偏移量的方式,可能会因为Spark和Zookeeper不同步,导致一份数据读取了两次。

    4、效率低。因为是分批次执行的,它是接收数据,直到达到了设定的时间间隔,才可是进行计算。

    2021-12-07 17:35:30
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Java Spring Boot开发实战系列课程【第16讲】:Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载
MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载
消息队列kafka介绍 立即下载