行业综述 | 《阿里云存储白皮书》第一章

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
简介: 本章重点介绍数字经济时代背景下存储行业的变革

下一篇:技术产品 | 《阿里云存储白皮书》第二章

点击免费下载
《阿里云存储白皮书》>>>

image.png

一、数字经济时代已经到来

1、基础设施的云化

自人类社会诞生以来,先后经历了农业经济、工业经济、网络经济等时代。今天,我们迎来了由IT经济、DT经济、智能经济所组成的数字经济时代。根据联合国《2019年数字经济报告》的统计,数字经济的规模约占全球生产总值的4.5%至15.5%之间,其中中国和美国是引领世界数字经济发展的首要力量。正如水之于农业经济时代,电之于工业经济时代一样,在数字经济时代,数据正在成为新的自然资源、新的战略资源。中国工程院院士、阿里云创始人王坚在其《在线》一书中认为,数据正在改变商业的本质。
根据IDC的相关预测,全球数据圈将从2018年的33ZB增至2025年的175ZB,实现5倍以上的增长。预计到2025年,中国数据圈将增至48.6ZB,占全球数据圈的27.8%。多方数据的汇聚以及对数据“存储-使用-管理”的全生命周期支撑能力、全方位的数据安全体系和健全的数据生态环境、以数据为中心实现数据价值最大化是以存储、计算、网络等基础设施所需要解决的重要问题。而今天,云计算已经在关键技术和应用规模上实现对传统基础设施的超越,基础设施全面云化的进程已将开启。

2、核心技术互联网化

作为分布式处理、并行处理和网格计算融合发展的云计算从2006年正式诞生,时至今日,云计算已经成为一门独立的学科。今天,大数据、物联网和人工智能等技术正在引领云计算的发展。在各行各业不断拥抱互联网的当下,在企业组织数字化转型的当下,在产业互联网蓬勃发展的当下,需要更加适合互联网场景的技术升级方案。从成立的第一天开始,阿里巴巴就具有了独特的互联网基因,在过去的二十年,阿里巴巴不断应对互联网时代的诸多挑战,从而在今天构建起并梳理了数字经济时代的底层范式和技术脉络。
基础设施的云化需要一套新的技术体系,需要基于互联网技术来进行改造。这其中最为明显的例子就是对象存储的兴起,在最初就将存储视为一种服务的对象存储,在应对互联网数据存储的规模化、高增长等问题的时候,提出了具有划时代意义的全新解决方案。对象存储面向互联网、移动互联网而生,专为大量网页、视频、图片、音频等数据的存储和管理等场景而设计。对象存储采用基于互联网的访问接口,其本质是通过互联网或移动互联网访问相关内容,为应用提供了全局、全网共享的数据池化管理,非常适合做为视频、社交、音乐等互联网应用的底层平台。现在,对象存储已经拥有了面向海量数据存储、快速访问的能力,不但可以构建数据统一分析平台,还可以进一步挖掘数据的价值,让存储更智能。
互联网经济的蓬勃发展很大程度上也源自于开源技术的繁荣。开放、开源是互联网技术的重要基因。阿里巴巴是开源的受益者,也是开源的贡献者。可以预见,下一代技术将构建在基于互联网技术、开源技术、云原生的云化基础设施之上,在这一过程中,阿里巴巴已经积累了丰富的经验和最佳实践,这套技术体系的可行性和先进性也已经被充分证明。

3、应用数据化和智能化

数据化和智能化是数字经济的重要特征,而云计算是应用数据化和智能化的有力保障。随着技术的不断发展以及架构的不断演化,云计算简化了传统IT产品的供应链流程,提升了产品弹性。在实现了平台和产品分离的同时,通过平台升级带动产品升级,实现了产品版本的快速迭代,使产品具备实时发布和实时使用的智能化特征。借助“数据+智能”这个出口,云计算将能够根据不同企业和组织的规模、类型、行业等为其量身打造。万事万物都将被数字化,都会因为数字化而产生进一步走向全面智慧化、智能化的空间和驱动力。
在具体实践中,数据智能服务已普遍应用在不同业务中来辅助人工决策。决策智能开始逐步代替人工,通过全流程智能化、自动化的升级,从辅助人工决策走向全流程自动化决策。以阿里云为例,在已经过去的以智能化为核心的2019年,阿里云已经进入了一个全新的发展阶段。以阿里云存储为例,在完成了以弹性扩展、灵活高效、降低成本为核心的存储基础服务以后,已经实现了支撑集团100%业务上云的目标,同时还帮助越来越多的客户实现数据管理的数字化和智能化。在针对不同业务场景上,阿里云发布了智能媒体管理视频型实例,为云上文档、图片、视频提供一站式数据处理、分析、检索等智能管理。阿里云存储不再是一个单一的底层平台,而是升级为数据智能管理的平台。

二、存储行业的变革

1、存储服务网络的巨变

云计算让原本离散的、依靠渠道实现分发的蒲公英网络演进为具有更高的服务效率、迭代效率、发现效率、运营效率等四大优势的平行网络。这其中,自服务是云计算核心的竞争力之一。传统IT技术所构建的商业模式不再成立,云计算的自服务能力让企业可以像使用水和电一样使用云计算产品,在可管理性方面有了极大的提升,也避免落入依赖技术和产品外包的服务陷阱。从这个角度来说,相比于强调所有权的公有云,强调使用权的公共云的概念其实更为贴切。
云存储是基于云计算相关技术延伸和发展而来的全新的产品形态。本质上,云计算不是一种计算,而是服务,云存储也不是一种存储,而是一种基于存储功能的服务。云存储的内核是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变。如同云状的广域互联网,云存储对使用者来讲,不是指某一个具体的设备,而是指一个由多个存储设备和服务器所构成的集合体。因此使用云存储时并不是使用某一个存储设备,而是使用整个云存储网络带来的一种数字化服务。

2、云原生对云存储的新要求

云原生(Cloud Native)的概念在2015年开始被提及,主要包括容器、服务网格、微服务、不可变基础设施和声明式API等技术领域。云原生计算基金会(Cloud Native Computing Foundation)认为云原生技术有利于组织在公共云、私有云和混合云以及新型动态环境中快速构建和运行可弹性扩展的应用。
全面上云的拐点已经到来:从单次购物节大促到日常业务运营,已经实现了常态化的上云;从边缘业务到核心链路和关键业务,已经实现了核心业务的上云;从几百台机器到超过十万台机器,已经实现了规模化的上云;从单一技术到全栈技术,已经实现了多样化的上云。上云已经成为一种必然。除此之外,上云不仅是业务需要面向云端,研发同样需要面向云端。云原生的出现让业务获得了更灵活的部署能力,同时也能够挖掘出在线数据的更大价值。
云原生应用对迁移性、扩展性和动态性的需求,对云原生存储也带来了相应的密度、速度、混合度的要求,因此需要云存储不断提高在效率、弹性、稳定、应用低耦合、安全等方面的能力。首先,云原生存储是面向应用的应用层存储,是云存储在用户接口和效率、易用性等优势的集合;其次,云原生存储利用云存储基础设施红利,是构建在应用存储之上的分层存储;第三,云原生提升了实现效率和自治方面的能力,提升了存储稳定性,降低了安全隐患。

3、智能与存储的交相辉映

人工智能技术的发展让存储产品在打破数据孤岛,提升数据管理效率等方面有了更多可能。阿里云提供了丰富的数据管理功能,通过数据分析挖掘数据价值。以阿里云日志服务的智能运维分析功能为例,该功能面向趋势预测、异常发现、智能聚类和根因分析等四个场景,提升了DevOps分析和诊断的效率,帮助运维人员提前配置资源,提前预测、发现和解决突发故障。
借助人工智能技术,阿里云存储产品在磁盘、服务与网络的故障检测中,可以更加准确地预测到故障的发生:在遇到网路抖动等异常状况时,可以做到及时规避,大大减少长尾延迟现象;在业务调度中,利用人工智能技术,能够提前进行负载均衡,避免热点的不均衡;在数据的放置策略中,可以根据对冷热数据的分析以及客户访问的规则与模式,将不同类型的数据进行分类,执行不同的置放策略,实现更加智能的分级存储,从而提高总体系统效能。针对机器学习与人工智能计算的场景,阿里云推出了高性能并行文件系统(CPFS:Cloud Parallel File System),并广泛应用于智能驾驶、生命科学和基因计算等场景。为了应对图片和视频数据的快速增长,对数据进行智能分析成为刚需,阿里云的智能媒体管理系统(IMM)将先进的分析算法与存储相结合,通过简单便利的调用接口,使得中小客户也可以享用到阿里云以及达摩院强大且先进的人工智能技术服务。

4、不可或缺的混合云存储

根据IDC的预测,到2021年,中国90%以上的企业将依赖于本地/专属私有云、多个公共云和线下数据中心的组合来满足其基础设施需求。同时,到2022年,50%的企业将部署统一的VMs、Kubernetes和多云管理流程和工具,用以支持跨本地和公共云部署的多云管理和治理。同时,85%的大型企业管理者表示不会将所有数据只存储在一个地方,会采用更多适合自身业务的存储方法,即在混合云环境中实现数据整个生命周期中的存储与流转。
通过混合云IT架构无缝上云已成为企业应用的新常态,混合云存储将成为架起本地数据中心和公共云的桥梁,是传统企业客户上云的新路径。从新旧业务的融合到云计算研发的混合部署,都离不开混合云的支持。不同的系统,在不同的时间点所呈现的状态也同样不同,作为一种产品化的解决方案,混合云可以说是公共云、私有云、本地基础设施部署优势的一个结合。云所提供的功能和业务越来越丰富,随着容器等云原生技术的发展,业务的跨云部署也将更加便捷,在权限管理、灵活性、性价比方面表现出更大的优势。目前,阿里云在灾备、网关、存储阵列等领域先后推出混合云解决方案,同时积极与伙伴展开合作,支持伙伴的数据平台与阿里云进一步的融合。

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
相关文章
|
7月前
|
安全 Java 大数据
基于大数据的旅游系统的设计与实现(论文+源码)_kaic
基于大数据的旅游系统的设计与实现(论文+源码)_kaic
|
机器学习/深度学习 人工智能 算法
实用!50个大厂、987页大数据、算法项目落地经验教程合集
大数据、算法项目在任何大厂无论是面试还是工作运用都是非常广泛的,我们精选了50个百度、腾讯、阿里等大厂的大数据、算法落地经验甩给大家,千万不要做收藏党哦,空闲时间记得随时看看! 如果你没有大厂项目经验,对大厂算法、大数据的项目运用不了解建议你看看!
|
存储 数据采集 分布式计算
云计算基础(持续更新)(上)
云计算基础(持续更新)
1195 1
|
云安全 安全 大数据
云上社交行业技术服务白皮书——第一章 前言
云上社交行业技术服务白皮书——第一章 前言
696 0
|
机器学习/深度学习 存储 分布式计算
云计算基础(持续更新)(中)
云计算基础(持续更新)
357 0
|
数据采集 并行计算 数据可视化
云计算基础(持续更新)(下)
云计算基础(持续更新)
965 0
|
存储 容灾 安全
技术产品 | 《阿里云存储白皮书》第二章
本章重点介绍阿里云存储的技术产品
5609 0
技术产品 | 《阿里云存储白皮书》第二章
|
机器学习/深度学习 自然语言处理 文字识别
【技术白皮书】第二章:发展历程与现状
从自然语言文本中获取结构化信息的研究最早开始于20世纪60年代中期,这被看作是信息抽取技术的初始研究,它以两个长期的、研究性的自然语言处理项目为代表。
|
机器学习/深度学习 SQL 存储
大数据小白如何入门?大数据领域75个核心术语讲解全盘奉上
  本文约8420字,建议阅读17分钟。本文介绍Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语。   近日,Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语,这不仅是大数据初学者很好的入门资料,对于高阶从业人员也可以起到查漏补缺的作用。本文分为上篇(25 个术语)和下篇(50 个术语)。   如果你刚接触大数据,你可能会觉得这个领域很难以理解,无从下手。不过,你可以从下面这份包含了 25 个大数据术语的清单入手,那么我们开始吧。   算法(Algo
498 0
|
Ubuntu Java 大数据
如何入门大数据之基础准备(一)(超级详细介绍)
如何入门大数据之基础准备(一)(超级详细介绍)
169 0