备案控制台

开发者社区大数据文章正文

关于大规模录入的数据流转

2017-11-23 1306

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

因为要双次录入，双次一致才入正式库。经过试点区数据录入的教训，决定改进一下数据在库中的流转，A与B在 Table_T 录完后，若对比相同，选其中一条数据进入 Table_M ，同时将 A与B 的数据从Table_T 中移出，原样转入 Back_TableT，复核员在 Table_M 中进行复核，如数据没问题时，再转移进 Table_F 。这样就有了4种同构表。临时表、中间表、备份表、正式表。

试点区数据时，因为程序的不完善，丢失了约2%的数据，还错位了一些数据，这次把所有的录入都原样保管，应该在程序出了问题时，仍能补救。如果在二个月后发现某项数据一直是错误的，会造成重大损失；

还有，这样转移的考虑是，我们对于大数据的处理十分缺乏经验，这样把集中操作分散开来，同时的一种操作也不过在一张几万行记录的表里，应该不会随时间对实时录入速度产生越来越严重的影响。

哪位朋友进行过大数据量或普查性质的表单实时录入软件，和俺联系了：）

本文转自 wenyan 51CTO博客，原文链接:http://blog.51cto.com/wenyan/10129

文章标签：

大数据

技术小牛人

目录

相关文章

诸葛子房

|

8月前

|

消息中间件存储 NoSQL

离线与实时数据开发方案

离线与实时数据开发方案

诸葛子房

138 0 0

龙大吉

|

7月前

|

数据采集存储数据挖掘

基于 StarRocks 的风控实时特征探索和实践

【6月更文挑战第9天】StarRocks 是一款高性能分析型数据库，适用于风控实时特征处理，提供快速数据分析，助力企业高效准确的风控决策。通过建立适合的数据模型，收集整合实时特征数据，并利用 StarRocks 的实时加载与查询功能，企业能实时计算风险指标。同时，确保数据准确性、一致性和完整性，以及进行性能优化，是实现高效风控的关键。随着业务发展，持续优化 StarRocks 应用将帮助企业应对复杂风险挑战，推动健康发展。

龙大吉

149 8 8

带你读小助手

|

canal SQL 弹性计算

实时数据及离线数据上云方案

本实验通过使用CANAL、DataHub、DataWorks、MaxCompute服务，实现数据上云，解决了数据孤岛问题，同时把数据迁移到云计算平台，对后续数据的计算和应用提供了第一步开山之路。

带你读小助手

299 0 0

大数据架构师

|

存储自然语言处理文字识别

非结构化数据怎么治理？

非结构化数据怎么治理？

大数据架构师

307 0 0

编程技术君

带你读《全链路数据治理-全域数据集成》之14：11. 附表：离线同步支持的数据源与对应的能力

带你读《全链路数据治理-全域数据集成》之14：11. 附表：离线同步支持的数据源与对应的能力

编程技术君

153 0 0

编程技术君

带你读《全链路数据治理-全域数据集成》之8：5. 附表：实时同步支持的数据源与对应的能力

带你读《全链路数据治理-全域数据集成》之8：5. 附表：实时同步支持的数据源与对应的能力

编程技术君

135 0 0

编程技术君

|

SQL 监控 DataWorks

带你读《全链路数据治理-全域数据集成》之7：4. 实时同步附加能力

带你读《全链路数据治理-全域数据集成》之7：4. 实时同步附加能力

编程技术君

203 0 0

编程技术君

|

关系型数据库调度数据库

带你读《全链路数据治理-全域数据集成》之13：10. 离线同步附加能力

带你读《全链路数据治理-全域数据集成》之13：10. 离线同步附加能力

编程技术君

168 0 0

编程技术君

|

弹性计算 DataWorks 数据库

带你读《全链路数据治理-全域数据集成》之4：1. 实时同步功能概述

带你读《全链路数据治理-全域数据集成》之4：1. 实时同步功能概述

编程技术君

247 0 0

编程技术君

|

数据采集弹性计算数据库

带你读《全链路数据治理-全域数据集成》之9：6. 离线同步功能概述

带你读《全链路数据治理-全域数据集成》之9：6. 离线同步功能概述

编程技术君

202 0 0

热门文章

最新文章

多中心容灾实践：如何实现真正的异地多活？

持续定义SaaS模式云数据仓库+数据银行

charles抓包显示乱码解决方法

千亿美元规模，云计算的下半场将走向何方？

DSP_代码笔记（基于TMS320X281x）

TypeScript 泛型

又爱又恨的BOOTSTRAP

AngularJS中使用service，并同步数据

平板电脑进化论：从玩具到工具

屌丝程序员在夏始春末拍的罗曼史之夏婚系列---结婚了

【C语言程序设计——循环程序设计】求解最大公约数（头歌实践教学平台习题）【合集】

【C++数据结构——栈与队列】顺序栈的基本运算（头歌实践教学平台习题）【合集】

【C语言程序设计——循环程序设计】统计海军鸣放礼炮声数量（头歌实践教学平台习题）【合集】

【C语言程序设计——循环程序设计】利用循环求数值 x 的平方根（头歌实践教学平台习题）【合集】

【C++面向对象——类与对象】Computer类（头歌实践教学平台习题）【合集】

【C++面向对象——类与对象】Computer类（头歌实践教学平台习题）【合集】

【C++数据结构——图】最短路径（头歌教学实验平台习题）【合集】

【C++数据结构——树】二叉树的性质（头歌实践教学平台习题）【合集】

【C++数据结构——树】哈夫曼树（头歌实践教学平台习题）【合集】

【C++面向对象——类与对象】CPU类（头歌实践教学平台习题）【合集】

相关课程

更多

阿里云实时数仓实战 - 数据生成及采集

实时数据应用：实现淘宝母婴订单实时查询和可视化

阿里云实时数仓实战 - 用户行为数仓搭建

阿里云 DTS是如何做实时数据集成的？

场景实践 - 使用MaxCompute进行数据质量核查

数据分析系统之数据管理与数据仓库

相关电子书

更多

交易风控数据的海量存储与多种离线计算处理

海量订单实时同步与处理实践

听云平台业务数据实时处理及性能可视化

相关实验场景

更多

基于EMR StarRocks实现游戏玩家画像和行为分析

配置流程编排实现根据天气情况播放歌曲

基于DTS构建一站式实时数据服务

实现淘宝母婴订单实时查询和实时大屏

lindorm多模间数据无缝流转

数据上云实验：基于星轨工具的dataphin批量数据上云

下一篇

DataWorks智能交互式数据开发与分析之旅