Serverless 应用的监控与调试问题之Flink流式数仓对于工商银行的数据链路要如何简化

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
实时计算 Flink 版,5000CU*H 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: Serverless 应用的监控与调试问题之Flink流式数仓对于工商银行的数据链路要如何简化

问题一:Flink OLAP在字节内部测试的表现如何?


Flink OLAP在字节内部测试的表现如何?


参考回答:

Flink OLAP能力在字节内部测试过可以媲美Presto,甚至在有些情况下更优。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/672018



问题二:工商银行实时大数据平台的数据流向是怎样的?


工商银行实时大数据平台的数据流向是怎样的?


参考回答:

工商银行实时大数据平台的数据流向是应用产生的数据写入MySQL或Oracle等关系型数据库,然后将数据库产生的日志复制到Kafka消息队列中作为实时处理平台的数据源。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/672019



问题三:工商银行实时大数据平台的实时处理平台有哪些数据出口?


工商银行实时大数据平台的实时处理平台有哪些数据出口?


参考回答:

工商银行实时大数据平台的实时处理平台有三个数据出口:一是通过Flink实时ETL实现实时数据入湖;二是将Flink的结果输出到HBase或ES等联机数据库中提供面向应用的数据中台服务;三是通过Presto或CK等分析型引擎,提供面向分析师的BI分析能力。

3.


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/672020



问题四:Flink流式数仓如何简化工商银行的数据链路?


Flink流式数仓如何简化工商银行的数据链路?


参考回答:

通过Flink的流式数仓,工商银行可以将中间贯穿很多系统和组件的复杂数据链路简化成Flink单链路,利用Flink的动态表(Dynamic Table)提供的流批实时分析一体化的能力来完成实时入湖、实时数据服务和实时分析。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/672021



问题五:金融行业在数据中台设计时如何考虑数据私密和安全?


金融行业在数据中台设计时如何考虑数据私密和安全?


参考回答:

金融行业在数据中台设计时采用的方法包括:全生命周期的数据监控审计、给数据本身加水印方便溯源、通过SQL实现自然人级别的动态数据访问权限控制、通过专家规则和Machine Learning来自动识别海量数据中的敏感数据。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/672022

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
目录
打赏
0
0
0
0
643
分享
相关文章
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
Serverless + AI 让应用开发更简单,加速应用智能化
Serverless + AI 让应用开发更简单,加速应用智能化
用友畅捷通在Flink上构建实时数仓、挑战与最佳实践
本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享,介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长,公司面临数据库性能瓶颈及实时数据处理需求,通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题,并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。
481 25
用友畅捷通在Flink上构建实时数仓、挑战与最佳实践
阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
面对机器学习场景下的训练瓶颈,微财选择基于阿里云 EMR Serverless Spark 建立数据平台。通过 EMR Serverless Spark,微财突破了单机训练使用的数据规模瓶颈,大幅提升了训练效率,解决了存算分离架构下 Shuffle 稳定性和性能困扰,为智能风控等业务提供了强有力的技术支撑。
173 15
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
阿里云实时计算Flink版测评报告
该测评报告详细介绍了阿里云实时计算Flink版在用户行为分析与标签画像中的应用实践,展示了其毫秒级的数据处理能力和高效的开发流程。报告还全面评测了该服务在稳定性、性能、开发运维及安全性方面的卓越表现,并对比自建Flink集群的优势。最后,报告评估了其成本效益,强调了其灵活扩展性和高投资回报率,适合各类实时数据处理需求。
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。
2091 73
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
Flink CDC 在阿里云实时计算Flink版的云上实践
本文整理自阿里云高级开发工程师阮航在Flink Forward Asia 2024的分享,重点介绍了Flink CDC与实时计算Flink的集成、CDC YAML的核心功能及应用场景。主要内容包括:Flink CDC的发展及其在流批数据处理中的作用;CDC YAML支持的同步链路、Transform和Route功能、丰富的监控指标;典型应用场景如整库同步、Binlog原始数据同步、分库分表同步等;并通过两个Demo展示了MySQL整库同步到Paimon和Binlog同步到Kafka的过程。最后,介绍了未来规划,如脏数据处理、数据限流及扩展数据源支持。
262 0
Flink CDC 在阿里云实时计算Flink版的云上实践
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
248 56
实时计算UniFlow:Flink+Paimon构建流批一体实时湖仓
实时计算架构中,传统湖仓架构在数据流量管控和应用场景支持上表现良好,但在实际运营中常忽略细节,导致新问题。为解决这些问题,提出了流批一体的实时计算湖仓架构——UniFlow。该架构通过统一的流批计算引擎、存储格式(如Paimon)和Flink CDC工具,简化开发流程,降低成本,并确保数据一致性和实时性。UniFlow还引入了Flink Materialized Table,实现了声明式ETL,优化了调度和执行模式,使用户能灵活调整新鲜度与成本。最终,UniFlow不仅提高了开发和运维效率,还提供了更实时的数据支持,满足业务决策需求。