文档备案控制台

开发者社区大数据与机器学习实时数仓 Hologres 正文

Hologres 针对宽表 Merge 场景是如何实现的？

Hologres 针对宽表 Merge 场景是如何实现的？

展开

收起

1358896759097293 2021-03-25 11:04:03 1711 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

1358896759097293

45271990@qq.com

宽表 Merge 场景例如一个用户的结果表有非常多的字段，会有上百列，而该表的许多字段可能同时分布在不同的数据上游，例如，Column C 和 D 分布在一个 kafka 的 topic A 上面， ColumnE 和 F 分布在 kafka 的 topic B 上面，用户希望消费两个 kafka topic，并将数据 merge 成 Hologres 的一张结构表。最常见的解决办法是，进行流场景的一个双流 Join。这种实现对于开发人员来说相对比较复杂，需要实现一个双流 Join，而且理论上来说会对计算资源要求非常大，也加剧了运维人员的负担。Hologres 支持局部更新的功能。如下图所示，按照这种实现方式，只需要两个流各自写入 Hologres 结果表。第一个流消费 ABCD 四个字段，将数据写入到最终的结果表中。第二个流消费 ABEF 四个字段，最终将数据写入到结果表，并不需要进行双流的 Join，最终 Hologres 会自己进行一个数据的组装。第一个流写入 ABCD 的时候并不会去更新已经存在的 EF 字段，同样，第二个流写入 ABEF 字段的时候，C 和 D 字段已经存在，不会被更新，最终达到完整的一个数据 Merge 的功能。使用这种功能，可以大大提升流作业的开发效率，以及减少流作业所需要的资源消耗，也能够更容易的维护各个流作业。

2021-03-25 14:01:52

赞同展开评论

问答分类：

实时数仓 Hologres

问答标签：

实时数仓 Hologres场景实时数仓 Hologres merge 实时数仓 Hologres宽表 hologres云原生多模数据库Lindorm 云原生多模数据库Lindorm hologres

问答地址：

开发者社区 > 大数据与机器学习 > 实时数仓 Hologres > 问答

相关问答

快手在实时数仓开发中为什么选择在某些场景使用API而不是SQL？

247

1

0

快手在活动频繁的场景下，如何快速响应和调整实时数仓？

259

1

0

Hologres的应用场景是什么？

206

1

0

Flink多流部分列更新场景，某条流出现delete操作会转化成最终sink大宽表的update吗？

242

1

0

如何搭建适用于业务场景的实时数仓？

217

1

0

Hologres在无人车送货场景中具体是如何应用的？

151

1

0

为什么分析服务一体化的理念会随着像Hologres这样的产品发展，在更多场景落地？

146

1

0

这个场景类似于实时数仓的结果宽表，如果我只使用polardb mysql，有好的更新方案吗？

223

1

0

DataWorks hologres中有没有类似merge into 的用法？

285

1

0

Hologres使用RoaringBitmap的方案可以适用于什么场景

221

1

0

大数据与机器学习

实时数仓 Hologres

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

我要提问

收录在圈子:

实时数仓Hologres

2633

+ 订阅

本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等，也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975

相关文章

Hologres CLI与Skills担当Agent-Ready 基础设施，共建数仓智能新生态

一条 SQL 生成广告：Hologres 如何实现素材生成到投放分析一体化

Hologres 4.1 新特性：基于 Stage 的离线导入，平衡吞吐与资源成本的最优解

AnalyticDB MySQL vs Hologres：阿里云内部数仓产品如何选——场景化选型指南

阿里云实时数仓 Hologres 对接使用完全指南

热门讨论

热门文章

Hologres中datav 价格怎么样？

CCO是什么？

update不支持更新distribution key的原因和解决办法

查询建表时间和更新时间

想实现mc的get_json_object之类功能在hologres里面查不出来呀？

在实时数仓Hologres中，使用flink去消费，不在需要每一个单独打开对应的binlog吧？

Hologres里用户在代码查询里报错怎么解决？

Hologres表数据变更时间怎么获取？

能从mysql迁移到Hologres吗？

Hologres这个标准 IO 读吞吐(byte/s) 的性能指标是什么样的？

展开全部

实时数仓Hologres V2.2发布，Serverless Computing降本20%

Hologres 4.0全新发布：AI时代的一站式多模态分析平台

Hologres揭秘:深度解析高效率分布式查询引擎

Hologres揭秘：高性能原生加速MaxCompute核心原理

使用实践｜Hologres性能调优全方位解读

首次揭秘云原生Hologres存储引擎

Hologres是如何完美支撑双11智能客服实时数仓的？

Hologres揭秘：如何支持超高QPS在线服务（点查）场景

Hologres CLI与Skills担当Agent-Ready 基础设施，共建数仓智能新生态

技术揭秘：从双11看实时数仓Hologres高可用设计与实践

展开全部

还有其他疑问?