在实时数仓建设中引入数据湖技术是为了解决实时数仓中任务数据的可重跑回溯范围小的问题。数据湖技术可以提供更大的数据存储能力和更灵活的数据访问方式,从而扩大数据的可重跑回溯范围。
随着云存储(尤其是对象存储)逐步成熟的大背景,数据湖的解决方案也逐步往云原生靠近。阿里云的湖仓一体架构,将OSS作为云上数据湖的统一存储,为您提供安全、低成本、高可靠、可扩展的数据湖方案。
实时数据湖是在湖仓一体架构下,更加注重数据的实时属性或者流属性的一个数据湖发展方向。Hologres充分利用自身实时写入、实时更新、实时分析的强大引擎能力,结合阿里云数据湖构建(Data Lake Formation,DLF)和阿里云对象存储(Object Storage Service,OSS)数据湖存储服务以及丰富的生态整合,为您提供了一套完整的实时数据湖解决方案。以外部表的方式,无需移动数据(外部表只做字段映射,不真正存储数据),直接加速读写存储于OSS上的各种格式类型的数据,降低开发运维成本,打破数据孤岛,实现业务洞察。
参考文档https://help.aliyun.com/zh/hologres/user-guide/product-overview?spm=a2c4g.11186623.0.i8
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。