80%以上是冷数据!昆腾的数据归档之道

简介: 中国的冷、温、热数据分别占比80%、15%和5%,冷数据是最多的。而对于冷数据来说,计算不是常态,主要是存储。中国算力中心的“存力”相对不足,中国数据存储产业大有可为。

在近日举行的2023年世界半导体大会上,权威人士表示,中国算力中心的“存力”相对不足,中国数据存储产业大有可为。


一年前,在2022年举行的首届中国算力大会上,就有权威人士曾指出,中国的冷、温、热数据分别占比80%、15%和5%,冷数据是最多的。而对于冷数据来说,计算不是常态,主要是存储。



当前,企业和组织正在生成和存储PB量级甚至EB量级的非结构化数据,如视频、高精图像、物联网数据等,这些数据大部分都是冷数据,需要保存数年甚至数十年之久


“冷温热”数据的区分及价值


对于数据的分类,有很多维度,但目前业界普遍达成的共识是以“数据的温度”为基准,把数据分为热、温、冷几个层次。


什么是数据的温度?其实就是数据的使用频度。数据被使用的频度越高,其“温度”越高,反之则越低。


热数据的使用频度最高,常见的如交易数据、用户的Cookies等。温数据的使用频度其次,通常按月或年的频率使用,比如网站数据、企业业务数据等。


冷数据实际就是归档数据,比如存放在网盘的照片,通常都是数月或者一两年才会访问一次。还有一种冷数据,一旦存储之后访问频度非常之低。但是为了满足合规要求,这些数据必须保存很长的时间,通常是数年甚至数十年之久。最为常见的是,医院的影像数据、档案馆的档案数据等。


数据温度的分类,可以这样通俗地去理解。它与书架放书的道理差不多,“经常要看的书放近点,不看的书放高一点,远一点”。


看到这里,您可能会有疑问,为什么要这样去做数据的分类?


其实很简单,区分热、温和冷数据的主要好处在于节省数据存储成本和提升在线数据查询性能。


昆腾:专注于海量数据的归档


对于数据的归档,磁带是最佳的选择介质,其能够将数据安全保存50年以上,而且LTO磁带驱动器向下兼容两/一代,因此可以让用户非常便捷地检索十几年前存入的数据。



长久以来,LTO磁带一直在为不同行业的用户提供成本最低的长期存储解决方案,对于PB量级的数据集,采用磁带解决方案的成本,对比公有云和其他冷数据存储解决方案,有着非常大的优势。昆腾的Scalar磁带系统拥有着对设备空间的高效设计、iLayer主动诊断和分析功能、自动监控和报告生成功能,以及与基于云端的AIOps软件实现的深度集成,不但大大减少了系统设备所需要的管理时间,更进一步降低了系统的总体拥有成本


昆腾Scalar磁带库采用的是模块化的设计,可大大简化为实现容量和性能的增长而需要的存储槽位与驱动器的添加工作。容量随需应变(CoD)槽位许可,提供了更为细化的存储粒度级别,可以通过按需付费的方式,更好地管理存储成本


昆腾Scalar系列磁带库是市场上最安全的磁带库系统,拥有超过25项的独特功能,形成了一套覆盖面极为广泛的安全架构,其中包括有系统访问控制,系统监控和事件检测,数据安全和加密,以及网络保护和数据完整性检查等等。


昆腾Scalar系列磁带库具备全面的高可用特性,提供确保系统保持可操作和可访问的状态。冗余电源和路径故障转移(通过机器臂控制和数据路径)提供了企业级系统所必需的容 错能力。此外,通过内置在iLayer软件中的智能功能,还可以提供更高级别的可用性作为高级功能,包括对环境和电源供应的监控,主动诊断、针对磁带介质和磁带驱动器的报告可以识别系统的整体运行情况,并在故障发生前通知用户系统所存在的潜在问题——并启用对磁带库系统的主动控制,以确保最大限度的正常运行时间。


昆腾Scalar系列磁带库的优势

相关文章
|
存储 运维 数据挖掘
技术干货:腾讯云为什么选择磁带库?
随着全球冷数据的持续爆炸,以及磁带介质数据密度提升的巨大潜力,磁带库的前景充满想象力。这篇文章讲述了磁带库在腾讯大规模落地的技术故事。
2369 0
|
存储 运维 安全
磁带存储技术演进简史
磁带使用的磁颗粒的密度,被证实可线性增加。当前的LTO磁带采用钡铁氧体磁体,单盘磁带的容量可以做到220TB;而采用锶铁氧体磁体的LTO磁带,单盘容量将轻松达到580TB!LTO技术联盟正是通过改进磁体颗粒密度的方法使得每盒磁带的容量得到巨大的提升,并已经在实验室研制出单盘容量为580TB的磁带产品。
622 0
|
机器学习/深度学习 数据处理 数据安全/隐私保护
DPU:数据中心与计算架构的革新引擎
【2月更文挑战第3天】
1657 1
DPU:数据中心与计算架构的革新引擎
|
存储 人工智能 算法
云计算的第三次浪潮:人工智能与云计算的融合
在2023年的云栖大会主论坛上,中国工程院院士、阿里云创始人王坚发表了题为《云计算的第三次浪潮》的主题演讲,他强调了人工智能与云计算的结合带来的重大影响,并认为这将引发云计算的第三次浪潮。云计算的第三次浪潮正在悄然兴起,其与人工智能的结合引发了前所未有的技术革命。那么本文将聊聊2023年人工智能和云计算的集中体现和爆发,以及云计算与GPT模型的关系。
1990 47
云计算的第三次浪潮:人工智能与云计算的融合
|
存储 安全 网络协议
阿里云SSL数字证书原理、使用、申请流程及部署方式
本文带您了解阿里云数字证书的基本原理、使用、申请流程及部署方式
|
Linux
nfs client高性能参数设置
linux kernel中sunrpc的实现是单连接和长链接的,为了提高并发性能,在单连接的基础上提供多个slot,通过tcp_slot_table_entries参数设置。slot个数越多,nfs请求并发处理能力越强,如果slot个数很小,而nfs请求又很多,就会在client排队等待。
9062 0
|
机器学习/深度学习 人工智能 达摩院
10万亿!达摩院发布全球最大AI预训练模型M6
今天,阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。
8394 0
10万亿!达摩院发布全球最大AI预训练模型M6
|
缓存 Linux 开发工具
CentOS 7- 配置阿里镜像源
阿里镜像官方地址http://mirrors.aliyun.com/ 1、点击官方提供的相应系统的帮助 :2、查看不同版本的系统操作: 下载源1、安装wget yum install -y wget2、下载CentOS 7的repo文件wget -O /etc/yum.
251076 0
|
2月前
|
缓存 人工智能 监控
MCP资源管理深度实践:动态数据源集成方案
作为一名深耕AI技术领域多年的开发者,我见证了从传统API集成到现代化协议标准的演进历程。今天要和大家分享的MCP(Model Context Protocol)资源管理实践,是我在实际项目中积累的宝贵经验。MCP作为Anthropic推出的革命性AI连接标准,其资源管理机制为我们提供了前所未有的灵活性和扩展性。在过去的几个月里,我深度参与了多个企业级MCP项目的架构设计和实施,从最初的概念验证到生产环境的大规模部署,每一个环节都让我对MCP资源管理有了更深刻的理解。本文将从资源生命周期管理的角度出发,详细探讨文件系统、数据库、API等多种数据源的适配策略,深入分析实时数据更新与缓存的最佳实践
81 0
|
11月前
|
敏捷开发 数据可视化 项目管理
快速提升工作效率:五大桌面工作安排软件深度评测
随着工作节奏的加快,合理高效地安排工作已成为职场人士和团队成功的关键。本文评测了五款流行的桌面工作安排软件:板栗看板、Trello、Asana、Notion 和 Microsoft To Do,帮助用户快速找到提升工作效率的最佳工具。每款软件都有其独特优势,如板栗看板的迭代管理、Trello 的灵活看板、Asana 的项目视图、Notion 的高度定制化以及 Microsoft To Do 的简洁易用。选择合适的工具,将有效提升个人和团队的工作效率。
227 1