Hive 全量表、增量表、拉链表解析-阿里云开发者社区

Hive 全量表、增量表、拉链表解析

2023-12-29 812

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

全局流量管理 GTM，标准版 1个月

云解析 DNS，旗舰版 1个月

公共DNS（含HTTPDNS解析），每月1000万次HTTP解析

简介： Hive 全量表、增量表、拉链表解析

1.全量表

（1）全量表，有无变化，都要报

（2）每次上报的数据都是所有的数据（变化的 + 没有变化的)

(3) 每天抽取

第一次:

id	name	money	time
1	a	10	2020-05-18 00:01:01
2	b	20	2020-05-18 10:00:00

第二次:

id	name	money	time
1	a	20	2020-05-19 00:01:01
2	b	20	2020-05-18 10:00:00
3	c	10	2020-05-19 00:01:01

分别抽数两次对应全量表

id	name	money	time	dt
1	a	10	2020-05-18 00:01:01	2020-05-18
2	b	20	2020-05-18 10:00:00	2020-05-18

id	name	money	time	dt
1	a	20	2020-05-19 00:01:01	2020-05-19
2	b	20	2020-05-18 10:00:00	2020-05-19
3	c	10	2020-05-19 00:01:01	2020-05-19

2.增量表：只要更新(新增、修改)就同步

第一次:

id	name	money	time
1	a	10	2020-05-18 00:01:01
2	b	20	2020-05-18 10:00:00

第二次:

id	name	money	time
1	a	20	2020-05-19 00:01:01
2	b	20	2020-05-18 10:00:00
3	c	10	2020-05-19 00:01:01

对应两次抽数增量表(需要监控表的改变)

id	name	money	time	dt
1	a	10	2020-05-18 00:01:01	2020-05-18
2	b	20	2020-05-18 10:00:00	2020-05-18

id	name	money	time	dt
1	a	20	2020-05-19 00:01:01	2020-05-19
3	c	10	2020-05-19 00:01:01	2020-05-19

3.拉链表：

(1)不需要像全量表，每天抽取所有数据(节省空间)

(2)可以查看某条记录的历史状态

第一次:

id	name	money	time
1	a	10	2020-05-18 00:01:01
2	b	20	2020-05-18 10:00:00

第二次:

id	name	money	time
1	a	20	2020-05-19 00:01:01
2	b	20	2020-05-18 10:00:00
3	c	10	2020-05-19 00:01:01

对应的拉链表

id	name	money	time	t_start	t_end
1	a	10	2020-05-18 00:01:01	2020-05-18	9999-12-31
2	b	20	2020-05-18 10:00:00	2020-05-18	9999-12-31

id	name	money	time	t_start	t_end
1	a	10	2020-05-18 00:01:01	2020-05-18	2020-05-18
1	a	20	2020-05-19 00:01:01	2020-05-19	9999-12-31
2	b	20	2020-05-18 10:00:00	2020-05-18	9999-12-31
3	c	10	2020-05-19 00:01:01	2020-05-19	9999-12-31

Hive 全量表、增量表、拉链表解析

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Hive 全量表、增量表、拉链表 解析

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

Hive 全量表、增量表、拉链表解析