开发者社区> 问答> 正文

Spark基于receiver的方式获取Kafka数据有什么缺点?

Spark基于receiver的方式获取Kafka数据有什么缺点?

展开
收起
游客fq2cv4o24bhvc 2021-12-07 17:33:46 447 0
1 条回答
写回答
取消 提交回答
  • 1、导致丢失数据。它是由Executor内的Receive来拉取数据并存放在内存中,再由Driver端提交的job来处理数据。这样的话,如果底层节点出现错误,就会发生数据丢失。

    2、浪费资源。

    3、可能会导致重复读取数据。由Zookeeper来记录偏移量的方式,可能会因为Spark和Zookeeper不同步,导致一份数据读取了两次。

    4、效率低。因为是分批次执行的,它是接收数据,直到达到了设定的时间间隔,才可是进行计算。

    2021-12-07 17:35:30
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载