转载链接: https://developer.aliyun.com/article/875124
来自:阿里云实时计算Flink 2022-03-09 506
简介: 汽车之家实时计算平台负责人邸星星在 FFA 2021 的分享
摘要:本文整理自汽车之家实时计算平台负责人邸星星在 Flink Forward Asia 2021 平台建设专场的演讲。主要内容包括:
应用场景
预算资源管控
Flink 伸缩容
湖仓一体
PyFlink 实践
后续规划
未来,我们会持续优化计算资源,让计算资源的利用更加合理化,进一步降低成本。一方面充分利用自动伸缩容的功能,扩展伸缩容策略,实现实时离线计算资源的混部,利用实时离线错峰计算的优势进一步降低实时计算的服务器成本。同时我们也会尝试优化 Yarn 的细粒度资源调度,比如分配给 jobmanager 和 taskmanager 少于一核的资源,做更精细化的优化。
在流批一体方面,我们准备利用 Flink 的批处理能力小范围做批处理的应用和 web 场景的试水。同时在数据湖架构的基础上,继续探索存储层面批流一体的可能性。最近我们还在关注 FLIP-188 提案,它提出了一个全新的思路,将流表和批处理表进行一定程度的统一,可以实现一次 insert 就把数据同时写入到 Logstore 和 Filestore 中,让下游可以实时消费 Logstore 的数据做实时 Pipeline,也可以使用 filestore 的批式数据做 ad_hoc 查询。后续我们希望也能做类似的尝试。