在选择云数据仓库ADB的湖仓版和数仓版时,您应该根据业务需求、数据规模、处理能力、成本预算和实时性需求来进行选型。具体如下:
业务需求:
数据规模和处理能力:
成本预算:
实时性需求:
综上所述,您可以根据业务需求、数据规模、处理能力、成本预算和实时性需求来选择最适合的版本。建议您在做出决策前,详细了解各自版本的特性和限制,并考虑未来的业务发展趋势。
湖仓版和数仓版的选择主要基于您的业务需求:
湖仓版(3.0):
具备低成本离线处理和高性能在线分析能力,实现了湖仓一体。
支持数据实时同步到湖(Hudi on OSS)或仓(C-Store),解决数据一致性与时效性问题。
提供计算存储分离架构、多语言可编程计算引擎Spark及资源弹性扩展能力。
适用场景包括离线处理、多源聚合分析、预测洞察(机器学习和AI)等。
数仓版(3.0):
弹性模式下基于计算存储分离架构,支持海量数据实时写入可见及高性能在线分析。
提供按需弹性扩容计算和存储资源,并支持数据冷热分层存储降低成本。
分为单机版和集群版,其中集群版适用于生产环境,具备分布式能力和高可用服务。
预留模式则具有高性能特点,适合查询加速、用户画像、实时数据服务等场景。
选择建议:
如果您的业务需要兼顾离线处理、在线分析以及湖仓一体的数据管理,同时希望降低成本并解决数据同步带来的问题,那么湖仓版(3.0)将是更优选择。
如果您主要是进行海量实时数据仓库构建、复杂ETL计算、大数据量的复杂查询或历史数据分析等场景,且对性能有较高要求时,数仓版(3.0)弹性模式或者预留模式可能更适合您。
若要从数仓版变配为湖仓版,可以通过提交工单联系技术支持进行评估,并在满足条件的情况下通过控制台进行缩容操作来完成变配。
此回答整理自钉群“云数据仓库ADB-开发者群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。