开发者社区> 问答> 正文

Spark基于receiver的方式获取Kafka数据有什么缺点?

Spark基于receiver的方式获取Kafka数据有什么缺点?

展开
收起
游客fq2cv4o24bhvc 2021-12-07 17:33:46 452 0
1 条回答
写回答
取消 提交回答
  • 1、导致丢失数据。它是由Executor内的Receive来拉取数据并存放在内存中,再由Driver端提交的job来处理数据。这样的话,如果底层节点出现错误,就会发生数据丢失。

    2、浪费资源。

    3、可能会导致重复读取数据。由Zookeeper来记录偏移量的方式,可能会因为Spark和Zookeeper不同步,导致一份数据读取了两次。

    4、效率低。因为是分批次执行的,它是接收数据,直到达到了设定的时间间隔,才可是进行计算。

    2021-12-07 17:35:30
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
任庆盛|Flink CDC + Kafka 加速业务实时化 立即下载
消息队列 Kafka 版差异化特性 立即下载
2019大数据技术公开课第五季—kafka 数据如何同步到 MaxCompute 立即下载