开发者社区> 问答> 正文

Spark基于driect的方式获取Kafka数据有什么优点?

Spark基于driect的方式获取Kafka数据有什么优点?

展开
收起
游客fq2cv4o24bhvc 2021-12-07 17:31:41 336 0
1 条回答
写回答
取消 提交回答
  • 1、当我们读取Topic下的数据时,它会自动对应Topic下的Partition生成相对应数量的RDD Partition,提高了计算时的并行度,提高了效率。

    2.它不需要通过WAL来维持数据的完整性。采取Direct直连方式时,当数据发生丢失,只要kafka上的数据进行了复制,就可以根据副本来进行数据重新拉取。

    3.它保证了数据只消费一次。因为我们将偏移量保存在一个地方,当我们读取数据时,从这里拿到数据的起始偏移量和读取偏移量确定读取范围,通过这些我们可以读取数据,当读取完成后会更新偏移量,这就保证了数据只消费一次。

    2021-12-07 17:32:44
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载