文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks在目的数据源中发现了超过这个时间的数据？

DataWorks离线同步读取kafka配置了endDateTime来指定所要同步的数据的截止范围，但是在目的数据源中发现了超过这个时间的数据？

展开

收起

真的很搞笑 2023-09-06 14:09:34 140 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

kafkareader在读数据的时候，是以batch的形式进行的，在读到的一批数据中，如果有超过endDateTime的，则停止同步，但是超出endDateTime的这部分数据也会被写入到目的端数据源。您也可以通过skipExceedRecord配置项来指定是否同步超出的数据。详细使用方法见Kafka Reader。【不建议设置为不同步，会有造成丢数据】您可以通过配置kafka的max.poll.records配置项来指定一次拉取数据的量，结合并发数，来控制可能超出的数据量。超出的数据量 < max.poll.records * 并发数
https://help.aliyun.com/document_detail/146663.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-09-06 15:09:22

赞同展开评论

问答分类：

消息中间件 DataWorks Kafka 大数据开发治理平台 DataWorks 云消息队列 Kafka 版

问答标签：

大数据开发治理平台 DataWorks数据大数据开发治理平台 DataWorks数据源大数据开发治理平台 DataWorks数据源数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

dataworks数据源测试通过，但是在配置数据来源与去向时没有可选择的表是什么原因呢？

225

3

0

dataworks创建hologres相关任务时提示数据源null不存在？

295

5

0

DataWorks中MC数据导出到FTP数据源时支持Z文件方式压缩么？

137

3

0

DataWorks在哪里配置数据源呀？

93

1

0

DataWorks新增Lindorm数据源，测试连通性时报错？

135

1

0

DataWorks在创建数据源的时候，显示加载数据失败，如何解决？

96

1

0

DataWorks此数据源不可被当前资源组连通，这个报错是啥问题呀？

161

1

0

dataworks 禁止部分ram用户修改数据源,删除工作空间等权限,应该怎么配置呢？

154

1

0

DataWorks离线同步，数据源是tablestore，主键区间的配置是这样，帮忙看看？

103

3

0

今天DataWorks配达梦数据源的是否，发现dm8并没有database的说法？

243

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

Redis 十大经典使用场景 - Go 语言实战指南

互联网医院看诊系统架构解析：从预约挂号到在线问诊的完整流程

AI 原生应用开源开发者沙龙·上海站精彩回顾 & PPT 下载

如何优化代码以提高淘宝商品详情API的调用效率？

外卖系统开发真的赚钱吗？90%的创业者可能选错了方向

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

热门讨论

热门文章

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

数据来源：com.alibaba.fastjson.JSONException: syntax er

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

你好，想购买dataworks，然后想问下报价？

在DataWorks中为什么运维中心还显示它有一个直接下游依赖？

DataWorks表管理创建表报precision and scale is not current

如何使用DataWorks数据集成从MySQL导入数据到GDB配置同步任务脚本？

odps表数据大小怎么查看

展开全部

云上一指禅：大数据产品DataWorks每日问答

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks售前咨询

DataWorks常见问题之一样IP的分库只有部分网络连通如何解决

欢迎加入飞天大数据平台交流群

DataWorks操作报错合集之如何处理数据同步时（mysql->hive）报：Render instance failed

大数据公共数据集上线，免费试用TB级数据分析

Qwen3 X DataWorks ：为数据开发与分析加满Buff !

展开全部

还有其他疑问?