文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 文章正文

实时计算 Flink版产品使用问题之Flink+DataHub+Hologres相比于Flink+Hologres加入了DataHub组件，有什么优势

2024-07-16 548

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：Flink这个默认的ck保存天数和保存个数是多少个？

Flink这个默认的ck保存天数和保存个数是多少个？

参考答案：

这是SP哈，CK是系统检查点，SP是作业快照。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/589611

问题二：Flink不设置这个默认多少条？

Flink不设置这个默认多少条？

参考答案：

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/589610

问题三：Flink引入或不引入 datahub ，有什么区别和优势？

Flink引入或不引入 datahub ，有什么区别和优势？

参考答案：

这要看贵公司选 datahub 在业务上来做什么事情了、是否有必要。对 Flink 而言是可以读写 datahub 的。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/589608

问题四：flink这两个搭配加入了 datahub 组件更具哪些优势？

flink+datahub+hologres 和 flink + hologres 加入了 datahub 组件更具哪些优势？就是我们公司做数仓，大数据架构准备使用 flink+datahub+hologres 这几个组件。

参考答案：

如果是数仓的话，Hologres 支持 binlog 感觉直接 Flink+Hologres 就可以搞定了

https://help.aliyun.com/zh/hologres/use-cases/build-real-time-data-warehouse-based-on-flink-hologres?spm=a2c4g.11186623.0.i14

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/589607

问题五：Flink整库同步过来的表不能开窗吗？

Flink窗口不支持撤回流，而cdc源表是含有撤回的流， cdc源表类型不支持开窗，更换为其他的源表类型即可整库同步过来的表不能开窗吗？

参考答案：

Flink的CDC（Change Data Capture）源表主要用于捕获数据库中的数据变化，并生成变更事件。这些变更事件可以用于多种场景，如数据同步、数据备份等。

关于您提到的“不支持开窗”，这可能是由于CDC源表的设计和实现决定的。CDC源表主要是为了捕获数据的变化，而不是为了进行复杂的分析或计算。因此，它们可能没有提供与Flink窗口函数相关的功能。

如果您的需求是进行窗口分析，并且需要使用Flink的窗口函数，那么可能需要考虑使用其他类型的源表，如Kafka或其他支持窗口功能的表。

另外，如果您正在进行整库同步，并且需要将数据同步到DataHub或其他存储系统，那么您可能需要考虑使用专门的同步工具或服务，而不是依赖Flink的CDC功能。这些工具通常会提供更全面的数据同步功能，包括对复杂数据转换和处理的支持。

总之，根据您的需求和场景，选择适合的源表类型和同步工具是实现整库同步的关键。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/589606

文章标签：

数据总线 DataHub

实时数仓 Hologres

实时计算 Flink版

流计算

数据处理

消息中间件

SQL

大数据

关键词：

实时计算 Flink版flink

实时计算 Flink版实时计算

flink实时数仓 Hologres

实时计算 Flink版Hologres

实时数仓 Hologres产品

三分钟热度的鱼

目录

相关文章

灵杰开发者

|

存储消息中间件 OLAP

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

本文整理自淘天集团高级数据开发工程师朱奥在Flink Forward Asia 2024的分享，围绕实时数仓优化展开。内容涵盖项目背景、核心策略、解决方案、项目价值及未来计划五部分。通过引入Paimon和Hologres技术，解决当前流批存储不统一、实时数据可见性差等痛点，实现流批一体存储与高效近实时数据加工。项目显著提升了数据时效性和开发运维效率，降低了使用门槛与成本，并规划未来在集团内推广湖仓一体架构，探索更多技术创新场景。

灵杰开发者

2083 3 6

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

穿过生命散发芬芳

|

SQL 运维网络安全

【实践】基于Hologres+Flink搭建GitHub实时数据查询

本文介绍了如何利用Flink和Hologres构建GitHub公开事件数据的实时数仓，并对接BI工具实现数据实时分析。流程包括创建VPC、Hologres、OSS、Flink实例，配置Hologres内部表，通过Flink实时写入数据至Hologres，查询实时数据，以及清理资源等步骤。

穿过生命散发芬芳

536 19 22

灵杰开发者

|

SQL 消息中间件 Kafka

Flink+Paimon+Hologres，面向未来的一体化实时湖仓平台架构设计

本文介绍了阿里云实时数仓Hologres负责人姜伟华在Flink Forward Asia 2024上的分享，涵盖实时数仓的发展历程、从实时数仓到实时湖仓的演进，以及总结。文章通过三代实时数仓架构的演变，详细解析了Lambda架构、Kafka实时数仓分层+OLAP、Hologres实时数仓分层复用等方案，并探讨了未来从实时数仓到实时湖仓的演进方向。最后，结合实际案例和Demo展示了Hologres + Flink + Paimon在实时湖仓中的应用，帮助用户根据业务需求选择合适的方案。

灵杰开发者

2026 20 21

Flink+Paimon+Hologres，面向未来的一体化实时湖仓平台架构设计

灵杰开发者

|

SQL 监控关系型数据库

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享，介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长，公司面临数据库性能瓶颈及实时数据处理需求，通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题，并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。

灵杰开发者

1032 25 26

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

灵杰开发者

|

存储 SQL Java

Flink CDC + Hologres高性能数据同步优化实践

本文整理自阿里云高级技术专家胡一博老师在Flink Forward Asia 2024数据集成（二）专场的分享，主要内容包括：1. Hologres介绍：实时数据仓库，支持毫秒级写入和高QPS查询；2. 写入优化：通过改进缓冲队列、连接池和COPY模式提高吞吐量和降低延迟；3. 消费优化：优化离线场景和分区表的消费逻辑，提升性能和资源利用率；4. 未来展望：进一步简化用户操作，支持更多DDL操作及全增量消费。Hologres 3.0全新升级为一体化实时湖仓平台，提供多项新功能并降低使用成本。

灵杰开发者

1017 1 1

Flink CDC + Hologres高性能数据同步优化实践

技术小达人

|

存储消息中间件 OLAP

Hologres+Flink企业级实时数仓核心能力介绍-2024实时数仓Hologres线上公开课03

本次分享由阿里云产品经理骆撷冬（观秋）主讲，主题为“Hologres+Flink企业级实时数仓核心能力”，是2024实时数仓Hologres线上公开课的第三期。课程详细介绍了Hologres与Flink结合搭建的企业级实时数仓的核心能力，包括解决实时数仓分层问题、基于Flink Catalog的Streaming Warehouse实践，并通过典型客户案例展示了其应用效果。

技术小达人

611 10 10

Hologres+Flink企业级实时数仓核心能力介绍-2024实时数仓Hologres线上公开课03

zdl

|

消息中间件运维大数据

大数据实时计算产品的对比测评：实时计算Flink版 VS 自建Flink集群

本文介绍了实时计算Flink版与自建Flink集群的对比，涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务，显著降低了运维成本，提供了强大的集成能力和弹性扩展，特别适合中小型团队和业务波动大的场景。文中还提出了改进建议，并探讨了与其他产品的联动可能性。总结指出，实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色，是大数据实时计算的优选方案。

zdl

844 56 56

技术小达人

|

SQL 消息中间件 Serverless

Flink+Paimon+Hologres，面向未来的一体化实时湖仓平台架构设计

Flink+Paimon+Hologres，面向未来的一体化实时湖仓平台架构设计

技术小达人

510 4 4

穿过生命散发芬芳

|

运维数据挖掘网络安全

场景实践 | 基于Flink+Hologres搭建GitHub实时数据分析

基于Flink和Hologres构建的实时数仓方案在数据开发运维体验、成本与收益等方面均表现出色。同时，该产品还具有与其他产品联动组合的可能性，能够为企业提供更全面、更智能的数据处理和分析解决方案。

穿过生命散发芬芳

657 5 6

六月的雨在钉钉

|

SQL 运维数据可视化

阿里云实时计算Flink版产品体验测评

阿里云实时计算Flink基于Apache Flink构建，提供一站式实时大数据分析平台，支持端到端亚秒级实时数据分析，适用于实时大屏、实时报表、实时ETL和风控监测等场景，具备高性价比、开发效率、运维管理和企业安全等优势。

六月的雨在钉钉

888 8 8

大数据与机器学习

实时计算 Flink

热门文章

最新文章

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

Skill即服务：用Agent安全玩转云上Flink

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

Flink Agents 0.3 Roadmap解读

相约深圳，全球征集｜Flink Forward Asia 2026 演讲议题征集正式启动

Flink CDC 3.6.0：支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

Apache Flink Agents 0.2.1 发布公告

（二）走进阿里云实时计算Flink版-场景案例篇

（一）走进阿里云实时计算Flink版-产品能力篇

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

基于Flink CDC的企业级日志实时入湖入流解决方案

相关产品

实时计算 Flink版

文档详情产品详情

相关课程

更多

实时数仓 Hologres 实战课程

实时数仓入门课程

阿里云实时数仓实战 - 项目介绍及架构设计

阿里云实时数仓实战 - 数据生成及采集

阿里云实时数仓实战 - 用户行为数仓搭建

阿里云实时数仓实战 - 作业调度与数据可视化

相关电子书

更多

实时数仓Workshop（广州站）- 李佳林

阿里云实时数仓Hologres技术揭秘2.0

实时数仓Hologres技术实战一本通2.0版（下）

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！