开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中Kafka Reader实现原理是什么?

DataWorks中Kafka Reader实现原理是什么?

展开
收起
真的很搞笑 2023-09-10 08:18:16 74 0
1 条回答
写回答
取消 提交回答
  • Kafka Reader通过Kafka Java SDK读取Kafka中的数据,使用的日志服务Java SDK版本如下所示。org.apache.kafkakafka-clients2.0.0主要涉及的Kafka SDK调用方法如下,详情请参见Kafka官方文档:使用KafkaConsumer作为消息消费的客户端。 org.apache.kafka.clients.consumer.KafkaConsumer
    根据unix时间戳查询Kafka点位offSet。 Map offsetsForTimes(Map timestampsToSearch)
    定位到开始点位offSet。 public void seekToBeginning(Collection partitions)
    定位到结束点位offSet。 public void seekToEnd(Collection partitions)
    定位到指定点位offSet。 public void seek(TopicPartition partition,long offset)
    客户端从服务端拉取poll数据。 public ConsumerRecords poll(final Duration timeout)说明 Kafka Reader消费数据使用了自动点位提交机制。
    https://help.aliyun.com/document_detail/137745.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-09-10 14:21:36
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多