文档备案控制台

开发者社区大数据与机器学习实时数仓 Hologres 正文

Hologres 针对宽表 Merge 场景是如何实现的？

Hologres 针对宽表 Merge 场景是如何实现的？

展开

收起

1358896759097293 2021-03-25 11:04:03 1734 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

1358896759097293

45271990@qq.com

宽表 Merge 场景例如一个用户的结果表有非常多的字段，会有上百列，而该表的许多字段可能同时分布在不同的数据上游，例如，Column C 和 D 分布在一个 kafka 的 topic A 上面， ColumnE 和 F 分布在 kafka 的 topic B 上面，用户希望消费两个 kafka topic，并将数据 merge 成 Hologres 的一张结构表。最常见的解决办法是，进行流场景的一个双流 Join。这种实现对于开发人员来说相对比较复杂，需要实现一个双流 Join，而且理论上来说会对计算资源要求非常大，也加剧了运维人员的负担。Hologres 支持局部更新的功能。如下图所示，按照这种实现方式，只需要两个流各自写入 Hologres 结果表。第一个流消费 ABCD 四个字段，将数据写入到最终的结果表中。第二个流消费 ABEF 四个字段，最终将数据写入到结果表，并不需要进行双流的 Join，最终 Hologres 会自己进行一个数据的组装。第一个流写入 ABCD 的时候并不会去更新已经存在的 EF 字段，同样，第二个流写入 ABEF 字段的时候，C 和 D 字段已经存在，不会被更新，最终达到完整的一个数据 Merge 的功能。使用这种功能，可以大大提升流作业的开发效率，以及减少流作业所需要的资源消耗，也能够更容易的维护各个流作业。

2021-03-25 14:01:52

赞同展开评论

问答分类：

实时数仓 Hologres

问答标签：

实时数仓 Hologres场景实时数仓 Hologres merge 实时数仓 Hologres宽表 hologres云原生多模数据库Lindorm 云原生多模数据库Lindorm hologres

问答地址：

开发者社区 > 大数据与机器学习 > 实时数仓 Hologres > 问答

相关问答

快手在实时数仓开发中为什么选择在某些场景使用API而不是SQL？

262

1

0

快手在活动频繁的场景下，如何快速响应和调整实时数仓？

269

1

0

Hologres的应用场景是什么？

226

1

0

Flink多流部分列更新场景，某条流出现delete操作会转化成最终sink大宽表的update吗？

250

1

0

如何搭建适用于业务场景的实时数仓？

233

1

0

Hologres在无人车送货场景中具体是如何应用的？

160

1

0

为什么分析服务一体化的理念会随着像Hologres这样的产品发展，在更多场景落地？

152

1

0

这个场景类似于实时数仓的结果宽表，如果我只使用polardb mysql，有好的更新方案吗？

239

1

0

DataWorks hologres中有没有类似merge into 的用法？

300

1

0

Hologres使用RoaringBitmap的方案可以适用于什么场景

228

1

0

大数据与机器学习

实时数仓 Hologres

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

我要提问

收录在圈子:

实时数仓Hologres

2633

+ 订阅

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

相关文章

Hologres CLI与Skills担当Agent-Ready 基础设施，共建数仓智能新生态

一条 SQL 生成广告：Hologres 如何实现素材生成到投放分析一体化

Hologres 4.1 新特性：基于 Stage 的离线导入，平衡吞吐与资源成本的最优解

AnalyticDB MySQL vs Hologres：阿里云内部数仓产品如何选——场景化选型指南

阿里云实时数仓 Hologres 对接使用完全指南

热门讨论

热门文章

Hologres中datav 价格怎么样？

update不支持更新distribution key的原因和解决办法

Hologres 用什么来管理数据的生命周期？

实例停机后怎么收费？

Hologres建表字符串默认都是bitmap索引，如果字符串的是高基数的，会不会有影响？

Hologres如何支持aes解密？

hologres如何使用jpa或者mybatisPlus进行操作？

update主键报错Feature not supported: UPDATE with shard

CCO是什么？

Hologres 针对宽表 Merge 场景是如何实现的？

展开全部

Hologres 4.0全新发布：AI时代的一站式多模态分析平台

实时数仓Hologres V2.2发布，Serverless Computing降本20%

Hologres揭秘:深度解析高效率分布式查询引擎

技术揭秘：从双11看实时数仓Hologres高可用设计与实践

Hologres+Flink企业级实时数仓核心能力介绍

Hologres揭秘：高性能原生加速MaxCompute核心原理

10亿+/秒！看阿里如何搞定实时数仓高吞吐实时写入与更新

首次揭秘云原生Hologres存储引擎

森马基于MaxCompute+Hologres+DataWorks构建数据中台

一条 SQL 生成广告：Hologres 如何实现素材生成到投放分析一体化

展开全部

还有其他疑问?