开发者社区> 沉默术士> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

云存储进化

简介:
+关注继续查看

大数据时代,PC互联网,移动互联网以及社交化平台的发展,让数据呈现几何化、爆炸式增长。而随着数据来源渠道的增多,网络的数据也不再是单一的数据类型,大量的非结构化数据涌现改变了数据的组成模式。如今大数据使得整个互联网科技都面临新一轮的洗牌,如何利用大数据将成为决定企业未来命运的关键!

那么大数据究竟有多大呢?可能很多人会问这个问题。2013年,世界上存储的数据预计能达到约1.2泽(约12亿TB)字节。12亿TB是个什么概念?如果把这些数据全存储于标准的光盘,这些光盘可以堆成五堆,每一堆都可以伸到月球。而如果把这些数据存储于1TB容量的硬盘中,那么将需要12亿块,这些硬盘可以分为五堆,每堆相当于长城的长度(6700公里)。

云存储是伴随云计算发展起来的一种新兴的存储模式,对于很多人来说是一个相对陌生的领域。其实云存储技术早已深入到我们的生活和工作中,只是很多人还没有意识到它的存在罢了,目前云存储技术已经在大数据解决之道方面有了一些案例。随着大数据时代的来临,云存储将担负更多的任务和使命

微软SkyDrive云存储

近日360网盘的推出以及与百度1TB竞争升级的事件相信大家都有所耳闻!没错,这些网盘其实就是最典型的云存储应用。这些云存储服务商为用户提供定量的存储空间,让用户实现通过PC、手机等终端进行访问等需求。网盘、云盘这些云存储技术是最典型也是最初级的云存储技术,如今一些企业已经将云存储技术有了更深层次的发展和创新,例如迅雷的云加速功能。

2013年互联网大会迅雷CEO邹胜龙将云存储加速带来的改变形容为:“让大数据像水一样的自由流淌。”在当时听到这句话的时候,我对这句话并不理解,据我所知,迅雷随身盘这种典型的云存储模式并没取得成功,而且即将在2013年9月1号停止支持,那么邹胜龙先生是为何在大会上反反复复强调迅雷云加速技术呢?又是如何让大数据能够自由流动呢?

迅雷对云存储技术有了更深层次的应用

带着这些不解,笔者翻看了迅雷云加速的一些业务。目前迅雷已经拥有高速通道、离线下载、迅雷云播、迅雷网游加速器、手机迅雷等多个产品,并且覆盖PC、手机、平板、TV四屏,可以说迅雷如今基本完成了对业务的全面布局。

根据笔者对这些业务的研究发现,在这些业务中,如离线下载、高速通道等很多服务都是基于云存储功能而实现的,可以说这些技术都是云存储技术的一种创新和演进。迅雷对云存储技术有了更深层次的应用,并不只是局限于传统的数据存取和数据保护,更是将云存储技术应用到下载、视频、网友等领域,是云存储技术应用到大数据方面的一个全新创新!

迅雷业务种类很多

迅雷利用云存储技术确保用户能够获得流畅、连贯的体验,而且还推出了根据账号实现云端同步的功能,可以说迅雷如今已经利用云存储实现了整个产品的布局,让大数据之间的传输更自由。那么迅雷是如何利用云存储技术的创新促进大数据之间的流动的呢?

下面我们就通过离线下载业务来看一下讲解下迅雷的云存储创新之处。

离线下载是迅雷云加速中的一个重要的功能,当下载的时候遇上冷僻的资源时,由于中国网络资源复杂,如果从原始服务器下载到本地,可能由于资源少、距离远等原因使得下载的速度不高,这样使用普通下载就会浪费大量的时间和电费。而当资源好,速度高的时候,则会影响用户正常的网络问题,造成别的任务无法完成。

迅雷离线下载每传输完一个文件,就会记录文件资源的地址,CID值,以及文件其他的特征信息。如此积累,迅雷便保存了大量文件的特征信息,当再有用户下载相同的文件时,迅雷云加速服务不再需要从资源所在的服务器下载文件,而是从迅雷云加速服务内部的资源中直接复制到用户的离线传输文件夹里,这样,一个几GB 甚至几十GB 的大文件在瞬间就传输完成了,因此很多人觉得离线下载极快,叫做‘秒杀’。

云存储后台需要什么样的支持?

“秒杀”下载并不是迅雷服务器神通广大,而是迅雷利用云存储技术的一种创新。这样能节省大量带宽用于传输迅雷云加速网络上不存在的新资源。正是利用这样的方法,迅雷不断积累资源,不断索引资源。但很长时间都没有人再下载的文件,迅雷云加速服务也会删除这个文件的索引信息,减少服务器空间占用。

离线下载业务实现了数据之间的快速传输,在大数据时代,让人们之间的数据流动性更欢快。但目前迅雷离线下载只提供给会员使用。如果你是会员用户,那么就可以依靠迅雷的服务器强大的下载功能下载文件,或者直接从迅雷服务器上直接下载别人已经下载的文件,等于复制粘贴,这样就节省了大量的时间,促进了数据间的流动。

云存储服务器需要强大的后台支持

目前迅雷每个月付费会员高达400多万,而且在400多万用户背后还有近3亿的免费用户,这些用户也可以用迅雷的离线下载业务,这必然需要强大的云存储平台支持,给用户提供离线下载业务,而且还要满足数据的文件总量的增长以及用户流量的激增的挑战。同时云存储平台需要不断的对其服务器平台进行存储容量、系统宽带,I/O的需求增加。

下面我们就来讨论下什么样的平台才能满足迅雷的需求。

要想搭建能够满足用户需求的云存储平台,我们首先需要先了解离线下载平台的原理:

(1)用户通过客户端或Web界面向服务器提交一个下载请求。

(2)服务器端接受请求,首先查询用户提交的下载链接是否被下载过。如果有,直接把已下载的数据文件(或只是文件的链接)放入用户服务器端的在线空间。如果没有,开启多线程实施下载(或用某公司自己特有的P2P方式)。

(3)下载完成后,用户在线登录到在线空间,取回下载的文件。其间也可以采用迅雷提供的P2P方式,从已下载或正在下载相同文件的用户那里取得数据。

(4)离线下载多针对冷门资源,或资源少的文件。待服务器端不是替用户下载完成后,用户还需要利用下载软件从服务器上下载文件。相比直接下载,增加了下载资源速度,节约了时间。

如何搭建离线下载支持平台?

那么需要多少服务器才能满足迅雷400万的会员以及将近3亿的普通用户需求呢?笔者开始误以为这个业务会需要很多服务器支持。但是通过对迅雷的离线下载平台进行研究后,发现支持离线下载的服务器并没有我们想象的那么多。毕竟这些用户并不可能同时下载数据,而且每个用户的下载也不可是都饱和,冷门的数据也并不是一直存储,所以对服务器的需求并没有想象的那么多。

下面我们来细分析一下这个平台的组成,可能大家就会明白为何并不需要那么的服务器就能够满足用户需求了。

离线平台需要离线下载服务器、WEB服务器、数据存储服务器三个平台共同支持。这三个平台都需要出色的性能支持,在处理器和内存方面并没有区别,主要区别是在存储硬盘方面的不同。

下面我们从性价比和需求方面来预测一下三种系统在存储方面的需求:

离线下载服务器主要提供的速度下载,所以对服务器的硬盘性能和容量要求较高。选择SAS硬盘为宜;数据存储服务器提供存储功能,对存储的容量要求高,但是对速度没有太大的需求。采用SATA硬盘为宜;Web服务器对硬盘的速度和性能要求高,但是对容量的大小没有太大的要求。采用SAS硬盘既可满足。

利用对云存储技术的改进和创新,迅雷解决了离线下载业务的支持问题。同时这种技术也能够胜任多种业务,如数据存储、数据库应用、高性能计算、计算机集群等领域。云存储技术让数据的存储更简单,灵活性更强。在大数据来临之际,云存储技术的创新与发展必将促使大数据发生新的革命,让数据真正的实现自由流动。


本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
云存储技术体系
云存储涉及的知识面很广,既涉及云存储服务端的技术,又涉及终端设备应用开发相关的技术。本文章关注云存储系统服务端技术。 云存储技术体系结构分为四层:硬件层、单机存储层、分布式存储层、存储访问层,下面分别介绍。
3481 0
上手七牛云存储
早就听说过七牛云存储,终于有时间上手实践。   1、第一步,注册七牛账号,由于是测试,首先申请的是个人账号   2、注册成功之后,默认是体验账号,每月只有1G的空间容量及1G的下载流量         3、账号认证,认证成功之后将升级为标准账号,每月有10G的空间容量及20G的下载流量       虽然认证麻烦了些,但看得出来,七牛还是很良心的,这种免费套餐对于一般的小型网站应用来说应该是足够了 说明一下,认证表单里,有一个“个人网址”的文本框,一开始我以为是空间的自定义域名,后来试了一下,应该就是个人网站地址,可以随便填,不影响使用。
1286 0
浅谈云存储安全
云存储服务可让用户将自己的数据存储在远程的服务器里,使数据享有数据备份、数据保密和动态存储空间等好处.另外,数据拥有者也可以指自己存储在云端空间的数据分享给特定人群.然而,在方便的云存储服务里,能否确保数据的安全性是大部分使用者所担忧的。
2389 0
云存储技术手册
找了个云存储专题说明。   云存储技术手册
584 0
+关注
5514
文章
253
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载