想请教一个关于Flink CDC海量归档数据存储的问题。我们有规划大概10亿/年的数据量,这些数据都是用CDC从各种业务平台得来的,我们想最终存储这些数据,作为归档和回溯用途,也就是作为最底层的全量存储。但是目前处于特殊原因,不能用Hbase(实际上之前用的是这个)。请问有其他最稳定合适的方案吗,各位大佬见多识广,有没有路过的指点下?谢谢~
用cassandra.不能用HBase 还是不能用NoSQL存储。不用HBase ,也就是直接归档OSS,查询使用外表查,反正是归档 查询慢很正常。cassandra 和 hbase 没什么太大区别,如果是不让使用KV存储,那cassandra也一样。,此回答整理自钉群“Flink CDC 社区”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。