80%以上是冷数据!昆腾的数据归档之道

简介: 中国的冷、温、热数据分别占比80%、15%和5%,冷数据是最多的。而对于冷数据来说,计算不是常态,主要是存储。中国算力中心的“存力”相对不足,中国数据存储产业大有可为。

在近日举行的2023年世界半导体大会上,权威人士表示,中国算力中心的“存力”相对不足,中国数据存储产业大有可为。


一年前,在2022年举行的首届中国算力大会上,就有权威人士曾指出,中国的冷、温、热数据分别占比80%、15%和5%,冷数据是最多的。而对于冷数据来说,计算不是常态,主要是存储。



当前,企业和组织正在生成和存储PB量级甚至EB量级的非结构化数据,如视频、高精图像、物联网数据等,这些数据大部分都是冷数据,需要保存数年甚至数十年之久


“冷温热”数据的区分及价值


对于数据的分类,有很多维度,但目前业界普遍达成的共识是以“数据的温度”为基准,把数据分为热、温、冷几个层次。


什么是数据的温度?其实就是数据的使用频度。数据被使用的频度越高,其“温度”越高,反之则越低。


热数据的使用频度最高,常见的如交易数据、用户的Cookies等。温数据的使用频度其次,通常按月或年的频率使用,比如网站数据、企业业务数据等。


冷数据实际就是归档数据,比如存放在网盘的照片,通常都是数月或者一两年才会访问一次。还有一种冷数据,一旦存储之后访问频度非常之低。但是为了满足合规要求,这些数据必须保存很长的时间,通常是数年甚至数十年之久。最为常见的是,医院的影像数据、档案馆的档案数据等。


数据温度的分类,可以这样通俗地去理解。它与书架放书的道理差不多,“经常要看的书放近点,不看的书放高一点,远一点”。


看到这里,您可能会有疑问,为什么要这样去做数据的分类?


其实很简单,区分热、温和冷数据的主要好处在于节省数据存储成本和提升在线数据查询性能。


昆腾:专注于海量数据的归档


对于数据的归档,磁带是最佳的选择介质,其能够将数据安全保存50年以上,而且LTO磁带驱动器向下兼容两/一代,因此可以让用户非常便捷地检索十几年前存入的数据。



长久以来,LTO磁带一直在为不同行业的用户提供成本最低的长期存储解决方案,对于PB量级的数据集,采用磁带解决方案的成本,对比公有云和其他冷数据存储解决方案,有着非常大的优势。昆腾的Scalar磁带系统拥有着对设备空间的高效设计、iLayer主动诊断和分析功能、自动监控和报告生成功能,以及与基于云端的AIOps软件实现的深度集成,不但大大减少了系统设备所需要的管理时间,更进一步降低了系统的总体拥有成本


昆腾Scalar磁带库采用的是模块化的设计,可大大简化为实现容量和性能的增长而需要的存储槽位与驱动器的添加工作。容量随需应变(CoD)槽位许可,提供了更为细化的存储粒度级别,可以通过按需付费的方式,更好地管理存储成本


昆腾Scalar系列磁带库是市场上最安全的磁带库系统,拥有超过25项的独特功能,形成了一套覆盖面极为广泛的安全架构,其中包括有系统访问控制,系统监控和事件检测,数据安全和加密,以及网络保护和数据完整性检查等等。


昆腾Scalar系列磁带库具备全面的高可用特性,提供确保系统保持可操作和可访问的状态。冗余电源和路径故障转移(通过机器臂控制和数据路径)提供了企业级系统所必需的容 错能力。此外,通过内置在iLayer软件中的智能功能,还可以提供更高级别的可用性作为高级功能,包括对环境和电源供应的监控,主动诊断、针对磁带介质和磁带驱动器的报告可以识别系统的整体运行情况,并在故障发生前通知用户系统所存在的潜在问题——并启用对磁带库系统的主动控制,以确保最大限度的正常运行时间。


昆腾Scalar系列磁带库的优势

相关文章
|
8月前
|
存储 算法 数据挖掘
服务器数据恢复-昆腾存储StorNext文件系统数据恢复案例
昆腾某型号存储,StorNext文件存储系统。 共有9个分别配置了24块磁盘的磁盘柜,其中8个磁盘柜存放普通数据,1个磁盘柜存放元数据。 存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列,还有4个全局热备硬盘。 存放普通数据的磁盘柜中的192块磁盘共组建了32组6盘RAID5阵列,32组RAID5阵列分为2个存储系统。
服务器数据恢复-昆腾存储StorNext文件系统数据恢复案例
|
缓存 异构计算 Perl
【毅力挑战】PCIe 每日一问一答(2022.04 归档)
【毅力挑战】PCIe 每日一问一答(2022.04 归档)
2799 3
【毅力挑战】PCIe 每日一问一答(2022.04 归档)
|
存储 关系型数据库 MySQL
存储成本最高降至原来的5%,PolarDB分布式冷数据归档的业务实践
国内某家兼具投资理财、文化旅游、票务为一体的大型综合型集团公司,2015年成立至今,由于业务高速发展,业务数据增长非常快,数据库系统屡次不堪重负。该公司数据库运维总监介绍,他们目前业务压力比较大的是票务和订单系统,他们的平台每天新增几千万的订单数据,订单的数据来自于各个终端,近几年每个月以300G的数据规模在高速增长,由于数据不断增加,数据库系统迄今为止迭代过了3次。
|
存储 缓存 API
带你读《云存储应用白皮书》之25:2. 数据归档上云方案
带你读《云存储应用白皮书》之25:2. 数据归档上云方案
277 0
|
存储 弹性计算 运维
不仅有0.0075元的深度冷归档,更有对下一代云存储的重新定义
阿里云存储的创新活力,不仅拓展了云存储的边界,更为客户如何挖掘数据无限价值方面,带来了更多的可能。11月4日,阿里巴巴集团高级研究员、阿里云智能存储产品线总经理吴结生,在云栖大会上做了《重新定义云存储,释放数据无限价值》的主题分享。
14726 0
不仅有0.0075元的深度冷归档,更有对下一代云存储的重新定义
|
存储 IDE 开发工具
【毅力挑战】PCIe 每日一问一答(2022.02 归档)
【毅力挑战】PCIe 每日一问一答(2022.02 归档)
4141 1
【毅力挑战】PCIe 每日一问一答(2022.02 归档)
|
缓存 C++
【毅力挑战】PCIe 每日一问一答(2022.03 归档)
【毅力挑战】PCIe 每日一问一答(2022.03 归档)
3905 1
【毅力挑战】PCIe 每日一问一答(2022.03 归档)
|
消息中间件 存储 XML
冷归档数据恢复最佳实践
对象存储OSS冷归档对象的读取需要先恢复出来,才可以读取,本文从用户角度介绍整个恢复的操作过程。
1054 1
冷归档数据恢复最佳实践
|
存储 物联网 分布式数据库
阿里云HBase发布冷存储特性,助你不改代码,1/3成本轻松搞定冷数据处理
9月27日,阿里云HBase发布了冷存储特性。用户可以在购买云HBase实例时选择冷存储作为一个附加的存储空间,并通过建表语句指定将冷数据存放在冷存储介质上面,从而降低存储成本。冷存储的存储成本仅为高效云盘的1/3,适用于数据归档、访问频率较低的历史数据等各种场景。
3395 0