文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC怎么做到，持续，实时，统计呢，我这里有些运营指标？

Flink CDC怎么做到，持续，实时，统计呢，我这里有些运营指标？

展开

收起

真的很搞笑 2023-08-01 15:27:06 238 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

Flink CDC是基于Flink的Change Data Capture（CDC）框架，可以实现实时的数据同步和流处理。为了实现持续、实时、统计等运营指标，可以结合Flink的流处理和计算能力，进行实时的数据分析和计算。
https://help.aliyun.com/zh/flink/videos/flink-cdc-technology?spm=a2c4g.11186623.0.i51

具体来说，可以按照以下步骤进行操作：

数据抽取：首先需要从源数据库（如MySQL、PostgreSQL等）中抽取数据变更，并将其转换为流数据，以便进行实时的处理和分析。可以使用Flink CDC提供的Connectors来实现数据抽取，或者根据实际情况自行开发数据源。

流处理：接下来可以使用Flink的流处理能力，对抽取的数据进行实时的处理和分析，计算各种运营指标。可以使用Flink提供的算子和函数，或者自行开发自定义算子和函数，来实现各种复杂的计算逻辑。
https://help.aliyun.com/document_detail/436877.html?spm=a2c4g.11186623.0.i57

数据存储：处理完毕后，需要将计算结果存储到目标数据源中，以便供后续查询和分析使用。可以使用Flink提供的Sink，将结果输出到各种数据源（如MySQL、Elasticsearch等）中，或者自行开发自定义Sink，来实现灵活的数据存储方式。

需要注意的是，为了实现持续、实时、统计等运营指标，需要对数据的处理和计算速度有较高的要求，需要使用高效的算法和优化技术来提高计算性能和准确性。同时，也需要针对具体的业务场景和数据特征，进行合理的数据分区和并行计算，以充分利用Flink的分布式计算能力。

2023-08-01 18:18:38

赞同展开评论
芯在这

公司还在用 BW4/HANA 做数仓是不是很落后了呀。感觉挺难用的，全部都用flink来做成本很高，也需要考虑数据持久化的问题，二次重算历史数据问题，此回答整理自钉群“Flink CDC 社区”

2023-08-01 15:32:17

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版指标实时计算 Flink版统计实时计算 Flink版cdc指标实时计算 Flink版运营

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

我们在用flink sql 做实时指标计算时，insert into语句能否动态修改？

290

0

0

Flink 使用维表加在 MC 的数据，MC中的某条数据变更了，sql统计的逻辑会变更吗？

238

1

0

如果我想配置flink任务的监控指标通过钉钉或者邮件外发，哪些指标比较具有参考价值呢？

213

1

0

在Flink CDC中，无锁的增量快照，等指标没输入数据stop job，这个咋实现？配置参数吗？

159

1

0

在银行业务中，通过Flink分析的业务流程和指标如何优化业务流程？

157

1

0

Flink为银行流程指标计算带来了哪些具体的收益？

187

1

0

建信金科如何利用Flink实现流程运营的实时计算？

191

1

0

在Flink为什么我的sql统计count的结果会有负数存在呢？

325

1

0

在Flink CDC中,那你打的datastream？指标数据正常吗？

163

1

0

对于Flink CDC，currentEmitEventTimeLag这个指标如何获取？

205

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

AI Agent 出问题时，不要只看最终回答：一次请求级调试的思路

AI 时代，实时入湖正在告别 ETL：从 Kafka 到 Iceberg 的架构减法

阿里云数据湖构建DLF完整对接指南：从元数据管理到多引擎集成实践

Kafka 原生消息入湖能力上线！一键打通实时流与数据湖

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flinkcdc在IDEA运行正常，打包就报错

如何用实时数据同步打破企业数据孤岛？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

Flink CDC2.4.1的版本sqlserver支持指定时间戳消费了吗？

展开全部

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

展开全部

还有其他疑问?