一文读懂人类信息存储进化史

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储OSS,敏感数据保护2.0 200GB 1年
简介: 感兴趣的同学可以点击文字最下方的链接,了解详情哦

感兴趣的同学,欢迎点击查看详情哦
在很久很久以前
那个时代语言和文字还没出现
人们的还都是通过“呜呜呜”的方式来进行沟通
但是事情还是得记的
因此“结绳记事”这种方法开始在人群里开始流行
但是,事情总归是越来越多,结也会越来越多
到最后究竟哪个节是哪个事情,谁也不知道
1.jpg

为了解决这个问题
仓颉创造了文字
人们开始把事情通过文字的方式记在
龟背和兽骨上
2.jpg

但动物资源毕竟是有限的
人们在获取这类资源时,也变得愈加困难
因此用竹子削平的竹简
凭借其简单易得且数量大的特点
开始收到人们的青睐
但是竹简毕竟还是太重了,记录和查看非常的不方便
3.jpg

于是到了东汉时期
纸就被发明出来,并被广泛应用
而纸作为一个跨时代意义的发明,一直沿用至今
并且仍是目前应用最广泛的存储载体之一
4.jpg

随着时间的发展
IT技术也正在茁壮发展
如果说纸解决了
时间到了1725年
Fritz Pfleumer发明了录音磁带,实现了模拟信号的存储
而磁带的诞生,也标示着磁性存储时代的开始
5.jpg

1932年磁鼓存储问世
它是一个大型金属圆柱体,外表面涂有铁磁记录材料
在当时被广泛应用于计算机内存和二级存储
因此也被认为是硬盘驱动器(HDD)的前身
6.jpg

到了1949年磁芯存储器被发明出来
它可根据磁化时电流的方向产生两个相反方向的磁化
这就实现了作为0和1的状态来记录数据
而其也是随机存取存储器(RAM)的早期版本
7.jpg

1956年世界上第一个硬盘驱动器出现
也就是我们现在说的机械硬盘(HDD)
8.jpg

该驱动器约有两个冰箱大小,重达一吨
包含约50个24英寸盘片
但只能存储5M的信息,数据传输速度也只有10K/S
9.jpg

终于时间到了1980年,
闪存在日本横空出世
其特点是断电后数据不消失且容量较大
其衍生的产品——SSD(固态硬盘)
目前仍被大家广泛使用
10.jpg

但是问题又来了
进入21世纪后,随着信息技术的飞速发展
人类的世界开始进入IT时代
短短几年时间数据的量级就远超前面好几百年的总和
数据也就逐渐成为了经济发展中的重要一环
根据IDC预测:到2025年,全球数据将会达到175ZB
如果我们拿一块专业级别的SSD盘举例
假设这一块SSD盘在正常情况下读写速度为2GB/s
那么存储完这么庞大的数据就需要
34年的时间才能存完
11.jpg

当然用一块硬盘存储完这么多数据是不现实的
肯定需要大量的硬盘来进行存储
我们就拿一块3.5英寸大小
内存为1TB的硬盘举例
12.jpg

就目前来说
大多数的数据还都保留在企业的自建机房中
线下存储带来的庞大资源需求
我想对于企业来说,会是一笔不小开销吧
并且在现实情况中企业往往不好预估自己所需要的存储量
一但买多了,就会造成不必要的浪费
同时企业还得专门请人进行运维、修复等工作
无形中就又增加了企业许多运营成本
13.jpg

并且尤其由于互联网的普及
信息经常是呈爆发式地出现
用户可能经常会短时间内涌入一个APP
14.jpg

因此很多互联网企业
需要在平时预留非常多的磁盘空间来应对这种情况
但是用这种方法的话
就会造成许多的资源浪费
因此一个具备高弹性、大容量、高性能以及高可靠的产品
就成为了这些企业的刚需
而上云,正是解决这些问题的最佳途径
15.png

在2008年
阿里巴巴就曾面临一个重大的危机
公司的“脑力”快不够用了
几亿用户无论是在淘宝剁手,还是支付宝上转账
这一切都要靠巨大的计算力来思考、记忆
16.png

和人一样:
如果这个“大脑”记忆被填满
就没办法储存新的商品和交易记录。
如果这个“大脑”思维速度跟不上
就没有办法让用户及时下单、付款。
因此阿里巴巴开始了他的上云之路
阿里云也应运而生
17.png

08年
业界首个大规模分布式存储引擎——盘古1.0
也就是大家耳熟能详的
阿里云“飞天操作系统”重要组成部分
正式飞天启航
18.jpg

经过十年的打磨与升级
盘古单集群已超过10万
其在2018年发布的盘古2.0分布式存储系统
在性能、可靠性、成本、自动化运维等方面都进行了提升
成为全球第一个实现了底层提供微秒级延迟与百万级IOPS的存储系统
20.png

这十年内
阿里云不仅是在技术上进行了升级
其产品更是经历了各种实战的磨练
21.jpg

在2018年
阿里云发布了全球首个百万IOPS云盘ESSD云盘
轻松支撑阿里经济体核心全面上云
扛住了2019年天猫双十一
交易峰值期54.4 万笔 / 秒的压力
阿里云ESSD作为服务企业核心业务场景的极致云盘
能为用户提供给高可靠、高性能、弹性拓展与运维这四块能力
帮助企业核心应用全面上云
22.png

振华重工——世界上最大的港口机械重型装备制造商
在连续多年占据全球港口机械市场70%份额基础上
希望从传统制造业向服务业转型
但高效全面及时的服务
需要端到端不同系统的打通和强大的数字系统做基础支撑
因此振华重工决定开始做数字化转型

相较于云上
线下存储部署成本相比线上更高、稳定性差
因此振华重工决定将ERP系统部署到了阿里云上
由于采用了阿里云ESSD云盘来承载SAP HANA核心业务数据
整体性能提升300%
并通过云端弹性扩容
免去设备采购、运维、机房管理等成本
TCO整整降低了30%
同时通过多可用区部署ERP应用及分布式存储高可用架构
让ERP核心业务连续性得到了有效保障
23.png

到了2020年7月
阿里云推出了入门级ESSD
采用与ESSD系列相同的技术架构
同样拥有亚毫秒级别的延时
单卷最大支持10000的IOPS
相比于上一代入门级云盘
每月仅需多花0.15元/GB,即可使用全闪云盘
大幅降低了全闪存储的使用门槛
让大部分企业更简单,更轻松地享受云的便利。
24.png

在数据上云的这条道路上
阿里云正在用技术的力量
为打造全新一代数据基础设施而努力
努力做到让技术的红利,普惠到每一位用户

对更多内容感兴趣的同学,欢迎点击查看详情哦

相关文章
|
Java 编译器 开发者
java中运行时异常与编译时异常?
java中运行时异常与编译时异常?
|
机器学习/深度学习 人工智能 自然语言处理
人工智能领域中训练、评估和推理概念的了解
人工智能领域中训练、评估和推理概念的了解
1086 0
|
3月前
|
机器学习/深度学习 自然语言处理 API
RM-Gallery: 一站式奖励模型平台
近年来,大型语言模型(LLMs)发展迅速,比如 ChatGPT、Qwen、Claude、 Llama。这些模型最初的能力来自预训练规模的扩展(pre-training scaling),即通过 “next-token prediction” 的任务,在海量语料上训练,从而获得通用能力。但是面对具体场景,由于场景任务目标不一定和通用能力匹配(比如对齐场景),所以预训练模型表现会有一些不足。为了在预训练之后进一步优化大型语言模型,近年来的研究开始转向训练后和测试时的规模扩展,其中奖励模型起着关键作用。
155 2
|
7月前
|
新能源
19期HR必读书单大揭秘:从薪酬体系搭建到绩效使能的实战指南
作为8年HR老兵,我深知HR在专业进阶中的迷茫。2023年数据显示76%的HR有知识焦虑。本文揭秘19期HR共读书单,涵盖薪酬体系、组织发展、招聘管理等全模块。如《薪酬管理从入门到精通》提供“3E模型”,《绩效使能》刷新OKR认知,《HRBP是这样炼成的》构建能力跃迁路线图。书单还包含实战攻略,如主题式阅读法与结构化笔记模板,助你将理论转化为实践,破解“知道但不会用”的困境。
185 18
|
9月前
|
机器学习/深度学习 算法 前端开发
图解前向、反向传播算法,一看就懂!
前向传播是神经网络中信息从输入层经过隐藏层传递到输出层的过程。每个神经元接收前一层的输出,通过加权求和和激活函数处理后传递给下一层,最终生成预测结果。此过程涉及输入信号、加权求和、激活函数应用等步骤。前向传播用于生成预测结果,在训练阶段与真实标签比较以计算损失函数,并在推理阶段直接生成预测值。反向传播则利用链式法则计算损失函数相对于权重的梯度,调整参数以减小误差,从而优化模型性能。两者结合实现神经网络的有效训练和预测。
|
9月前
|
机器学习/深度学习 存储 人工智能
【科普向】模型蒸馏和模型量化到底是什么???
在数字化快速发展的时代,人工智能(AI)技术已广泛应用,但大型深度学习模型对计算资源的需求日益增长,增加了部署成本并限制了其在资源有限环境下的应用。为此,研究人员提出了模型蒸馏和模型量化两种关键技术。 模型蒸馏通过将大型教师模型的知识传递给小型学生模型,利用软标签指导训练,使学生模型在保持较高准确性的同时显著减少计算需求,特别适用于移动设备和嵌入式系统。 模型量化则是通过降低模型权重的精度(如从32位浮点数到8位整数),大幅减少模型大小和计算量,提高运行速度,并能更好地适应低配置设备。量化分为后训练量化和量化感知训练等多种方法,各有优劣。
|
缓存 前端开发 JavaScript
优化的艺术:提升网站性能的十大关键技术策略
【7月更文第9天】在当今快速发展的互联网时代,网站性能直接影响用户体验和业务转化率。一个高性能的网站不仅能够吸引并留住用户,还能在搜索引擎排名中占据有利位置。本文将深入探讨提升网站性能的十大关键技术策略,并提供实用的代码示例帮助开发者实施这些优化措施。
844 3
|
11月前
|
人工智能 运维 安全
阿里云研发副总裁蔡德忠受邀参加乌镇峰会,畅谈AI与下一代互联网
2024年乌镇峰会“下一代互联网论坛”近日举办,主题为“创新驱动,安全赋能,共筑开放与安全的下一代互联网”。阿里云智能集团研发副总裁,基础设施网络研发负责人蔡德忠受邀参与圆桌讨论,并就人工智能(AI)与下一代互联网的融合发展分享了前瞻性见解。
|
机器学习/深度学习 人工智能 自然语言处理
揭秘In-Context Learning(ICL):大型语言模型如何通过上下文学习实现少样本高效推理[示例设计、ICL机制详解]
揭秘In-Context Learning(ICL):大型语言模型如何通过上下文学习实现少样本高效推理[示例设计、ICL机制详解]
揭秘In-Context Learning(ICL):大型语言模型如何通过上下文学习实现少样本高效推理[示例设计、ICL机制详解]
|
自然语言处理 数据可视化 API
优化采样参数提升大语言模型响应质量:深入分析温度、top_p、top_k和min_p的随机解码策略
本文详细解析了大语言模型(LLM)的采样策略及其关键参数,如温度和top_p。LLM基于输入提示生成下一个标记的概率分布,通过采样策略选择标记并附回输入,形成循环。文章介绍了对数概率(logprobs)、贪婪解码、温度参数调整、top-k与top-p采样等概念,并探讨了min-p采样这一新方法。通过调整这些参数,可以优化LLM输出的质量和创造性。最后,文章提供了实验性尝试的建议,帮助读者在特定任务中找到最佳参数配置。本文使用VLLM作为推理引擎,展示了Phi-3.5-mini-instruct模型的应用实例。
835 6