在双 11 大促中规模化使用 Flink 流批一体到最终落地,整个改造过程大致可以分为哪几个关键阶段?
第一个阶段是设计。首先需要拆解和梳理天猫实际情况,完成流批一体模型的统一。然后需要在平台这一侧把源数据打通,实现用户只写一套代码,平台自动翻译成 FlinkBatch 任务和 Flink Stream 任务,同时写到一张 Holo 表,完成计算层表达的统一。
第二个阶段是落地。流批一体需要依赖离线的调度,因此需要对 MaxCompute 平台做一定程度的打通。
第三个阶段是优化。包括语义层表达的优化,比如以前写的趋势图逻辑可能针对流场景做了针对性优化,但在批上面不起作用甚至可能存在问题,这些特殊场景需要做语义对齐;也包括性能的优化,以保证在双 11 可以达到性能目标。
第四阶段是稳定性。由于整条链路改动比较大,双11场景对稳定性的要求又特别高,因此团队重点展开了数据全链路的压测,以保证 Flink 本身流批计算性能、Hologres 的查询性能和上层 BI 层的查询性能,都能够满足双 11 的 QPS 诉求。
以上内容摘自《开源大数据前瞻与应用实战》电子书,点击https://developer.aliyun.com/topic/download?id=1153可下载完成版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。