数据湖,已成为海量数据存储与分析的重要承载方式(附白皮书下载)-阿里云开发者社区

开发者社区> 阿里云存储服务> 正文
登录阅读全文

数据湖,已成为海量数据存储与分析的重要承载方式(附白皮书下载)

简介: 在云计算和大数据时代,基于数据开展生产、运营、决策成为常态,根据Gartner报道,2019年数据基建方面的采购费用飙升到660亿美元,占据基础架构类软件费用的24%。数据的存储及应用体系是企业生态运转的中枢神经,数据湖已经成为海量数据存储与分析的重要承载方式。

在汹涌而至的信息化浪潮下,大数据技术不断更新迭代,数据管理工具得到飞速发展,相关概念也随之而生。数据湖(Data Lake)概念自2011年被推出后,其概念定位、架构设计和相关技术都得到了飞速发展和众多实践,数据湖也从单一数据存储池概念演进为支撑高效、安全、稳定企业级数据应用的下一代基础数据平台。

 

wp1.png

 

此次发布的《数据湖应用实践白皮书》涵盖了数据湖的定义与架构、数据湖核心组件与方案介绍、数据湖构建方案、应用实践等内容,希望为用户提供新的洞察。

 

wp2.png

 

通过阅读本书,包括开发者、IT运维人员、企业数字化管理者等可以全面了解阿里云基于云原生技术的企业级数据湖解决方案和相关产品,也能明晰传统数据仓库和数据湖的差异。 

 

wp3.png

 

在云计算和大数据时代,基于数据开展生产、运营、决策成为常态,根据Gartner报道,2019年数据基建方面的采购费用飙升到660亿美元,占据基础架构类软件费用的24%。数据的存储及应用体系是企业生态运转的中枢神经,数据湖已经成为海量数据存储与分析的重要承载方式

 

wp4.png

 

市场调研机构Research and Markets发布的报告显示,2020年,全球数据湖市场的价值为37.4亿美元,预计到2026年将达到176亿美元,在2021年至2026年的预测期间的复合年增长率为29.9%。

 

wp5.png

 

云原生时代的到来,引领数据湖进入了“云湖共生”新的阶段。在此背景下,阿里云推出基于云原生技术的企业级数据湖解决方案,该方案采用了存储计算分离架构,存储层基于阿里云对象存储OSS构建,并与阿里云数据湖分析(Data Lake Analytics 简称 DLA)、数据湖构建(Data Lake Formation简称 DLF)、E-MapReduce(简称EMR)、DataWorks(简称DW)等计算引擎无缝对接,且兼容丰富的开源计算引擎生态。

 

wp6.png

 

十年踪迹十年心,结合先进的数据科学与机器学习技术,数据湖还能为企业提供预测分析,帮助企业构建、优化训练模型等。希望这本白皮书可以为企业和组织的数字化转型实践提供指引,为相关领域的业务决策者与实践者提供面向行业应用场景的重要参考。


打开 https://developer.aliyun.com/topic/download?id=1164 ,可获取白皮书全部内容。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

阿里云存储基于飞天盘古2.0分布式存储系统,产品多种多样,充分满足用户数据存储和迁移上云需求。

官方博客
最新文章
相关文章
存储产品
客户案例