"在实时数仓建设过程中,遇到了以下主要问题:
将离线任务转为实时计算任务后,由于计算逻辑复杂(如多流JOIN、去重),导致作业状态过大,出现OOM异常或作业算子背压太大。
维表Join过程中,明细流表与大维表Join时,维表数据过多,加载到内存后导致OOM,作业失败无法运行。
Flink将流维表Join产生的多维明细数据写入ClickHouse时,无法保证Exactly-once,作业Failover时可能导致数据重复写入。
"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。