备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

面对数据延迟导致的问题，模型层应该如何设计

目前数据集成拿到的数据，基本都是t+1，有部分数据源会直接在原数据上修改，比如，我18.37未支付，18:38已支付并且已下单，18:39为已支付待发货，第二天拿过来的数据其实只有一条已支付待发货.

这些历史数据可能有用，但是不精确，我应该保留他们吗？或者怎么处理合适呢？

展开

收起

离原 2023-02-17 10:56:14 669 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友

其实就是对历史数据的处理，需要结合具体的业务场景和分析目的进行考虑。

如果历史数据可以提供有用的信息，比如可以帮助建立模型、分析趋势或者支持决策等，那么可以考虑将其保留。但是，需要对数据进行清洗和加工，以使其更准确和可靠。

对于你提到的这种情况，可以考虑将18:37的未支付数据和18:39的已支付待发货数据合并，得到完整的订单信息。如果历史数据有多个时间点的记录，可以根据时间顺序将其按照时间顺序合并。同时，在数据清洗过程中，需要注意数据的一致性和准确性，比如可以进行数据去重、数据验证、异常值处理等，以确保最终的数据结果可靠。

2023-02-17 11:54:20

赞同 1 展开评论

问答分类：

数据集成 Data Integration 大数据开发治理平台 DataWorks

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

84201

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

4081

1

0

重启Docker后报错：Error response from daemon

2527

0

0

this xml file does not appear to have any style in

52182

10

0

LoRa的网络覆盖能力范围是怎么样的？

3312

1

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

61125

32

0

sql server的用户名和密码怎么查啊？

37728

21

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3802

1

0

OSS的endpoint如何查看

37651

6

0

yyyy-MM-dd'T'HH：mm：ss.SSSZZ和yyyy-MM-dd'T'HH：mm：ss.

39919

9

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

springboot项目集成dolphinscheduler调度器实现datax数据同步任务

免费玩转阿里云DataWorks！智能Copilot+用户画像实战，开发效率翻倍攻略

DataWorks接入Qwen3-Coder！数据开发再提速！

数据开发再提速！DataWorks正式接入Qwen3-Coder

【赵渝强老师】阿里云大数据集成开发平台DataWorks

热门讨论

热门文章

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

DataWorks ODPS SQL任务中使用调度参数是什么？

DataWorks常见问题实时任务，运行报错：？

dataworks新增mysql数据源-ecs自建数据库，连通性测试报错，这个怎么解决呢？

DataWorks运维中心的运行诊断功能在进行任务诊断时包括哪几部分？

DataWorks还有一个问题,我这个实时同步任务每7天failover一次,这个正常吗？

DataWorks 为啥在开发环境代码运行没问题，生产环境运行报错，而且这个错事啥意思？

DataWorks实时同步任务没办法自动重启吗？

DataWorks 实时同步是否可以创建一个任务同步多个 Postgres Database 的数？

dataworks 数据集成里同步任务的时候报错了，请问是什么原因呢？

展开全部

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

语雀+通义千问+DataWorks，让AI定期推送每周总结

数据管理能力成熟度模型

欢迎加入DataWorks产品钉钉交流群

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

数据一致性比对（番外）

基于DataWorks搭建新零售数据中台

展开全部

还有其他疑问?