开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中Kafka Reader实现原理是什么?

DataWorks中Kafka Reader实现原理是什么?

展开
收起
真的很搞笑 2023-09-10 08:18:16 60 0
1 条回答
写回答
取消 提交回答
  • Kafka Reader通过Kafka Java SDK读取Kafka中的数据,使用的日志服务Java SDK版本如下所示。org.apache.kafkakafka-clients2.0.0主要涉及的Kafka SDK调用方法如下,详情请参见Kafka官方文档:使用KafkaConsumer作为消息消费的客户端。 org.apache.kafka.clients.consumer.KafkaConsumer
    根据unix时间戳查询Kafka点位offSet。 Map offsetsForTimes(Map timestampsToSearch)
    定位到开始点位offSet。 public void seekToBeginning(Collection partitions)
    定位到结束点位offSet。 public void seekToEnd(Collection partitions)
    定位到指定点位offSet。 public void seek(TopicPartition partition,long offset)
    客户端从服务端拉取poll数据。 public ConsumerRecords poll(final Duration timeout)说明 Kafka Reader消费数据使用了自动点位提交机制。
    https://help.aliyun.com/document_detail/137745.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-09-10 14:21:36
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    Java Spring Boot开发实战系列课程【第16讲】:Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载
    MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载
    消息队列kafka介绍 立即下载

    相关实验场景

    更多