开发者社区 问答 正文

基于Direct的方式如何从Kafka中获取数据?

基于Direct的方式如何从Kafka中获取数据?

展开
收起
芯在这 2021-12-11 22:34:27 281 分享 版权
1 条回答
写回答
取消 提交回答
  • 这种新的不基于Receiver的直接方式,是在Spark 1.3中引入的,从而能够确保更加健壮的机制。替代掉使用Receiver来接收数据后,这种方式会周期性地查询Kafka,来获得每个topic+partition的最新的offset,从而定义每个batch的offset的范围。当处理数据的job启动时,就会使用Kafka的简单consumer api来获取Kafka指定offset范围的数据

    2021-12-11 22:35:34
    赞同 展开评论