让ILM见见鬼

简介:

ILM(信息生命周期)是EMC花了几年苦心经营的一个概念,现在很多存储厂商也在谈这个概念。所谓信息信息生命周期就是企业的信息都有自己生命周期,如:某个客户的联系方式这个信息,1个月内也许非常重要,但是时间长了,联系方式也许已经变更就不那么重要了,但还是有保存的价值。为什么要推一个ILM概念呢?就是为了推动与存储厂商利益息息相关的东西分层存储。存储其实就是保存信息,没有什么难的。存储的方式很多,比如服务器内存、磁盘、磁带等等,当然存储速度越快的介质价格就高一些。而分层存储的目的就是根据信息在生命中的不同时期将企业信息进行分层存储。信息处于最重要时期时将它放在价格昂贵的快存储设备上,等一段时间后信息变的不再重要再自动将它放在价格低廉的慢存储设备上,通过分层存储这种方式实现企业的高效存储。其实分层存储我们都在干,只是以前是网络技术人员对信息一段时间进行整理,然后存储到别的介质中去而已。而分层存储就是通过软件系统,自动实现这种分层存储(但是说起来容易,做起来好象很难)。对于我国的中型甚至某些大型企业来说,ILM都应该去见鬼,当然就更何况中小企业了。

ILM见鬼之一:智能化要求太高
要实现ILM分层存储,首先就要求我们能对企业的各种信息进行分类。并且要明确各个信息的生命周期,但是企业信息数据种类很多(如:图像、音频、视频以及实时在线数据等),类型变化也快(如:电子邮件、ERP数据、CRM信息等),别说让计算机自己按规定分析了,就是让人去界定这些数据的生命周期都很难,能界定都是模糊界定。我们都昏昏,怎么能让存储系统昭昭呢。

ILM见鬼之二:赚你钱没商量
在所有存储厂商的公告中都会发现,存储厂商50%以上的钱是软件和服务。这些存储软件干什么用呢,一部分是加快存储和备份恢复的速度,另一部分就是来搞分层存储了。因为分层存储的要求高,所以软件系统也相对庞大,需要做的判断就很多,自然就昂贵多了。一个做存储的兄弟就曾经告诉我,往往是不分层50万就能搞定的硬件存储,500万也不能实现完善的分层存储。

ILM见鬼之三:哪来这么多要存储的信息
回到存储的本源,一个企业有多少信息需要处理。当厂商们惊呼TB数量级别的时候,我们不禁在问存的是什么东西?当然电信、高科技计算、大型网站这样的企业还是需要的,不过对于绝大部分企业来说,真有这么多东西需要存储吗。如果简单折算一下TB是什么概念:1TB=1000GB=100万MB如果用文本来放文字,那就是5000亿汉字。当然如果放上各种公司领导照片也许能少放点,不过放这种照片和语音最好就不要分层了,直接丢在最慢的磁带存储上。有如此多的数据需要存储的话,那这个公司的数据体系确实需要进行一番规划了。

ILM见鬼之四:别拿硬盘不当回事
分层存储的核心就是合理分配快存储和慢存储。但是现在硬盘价格已经大幅度跳水,160GB硬盘才600多人民币,计算一下。就算1TB也就在6000多,批量好象价格更低。相比于动眦几十万,成百万的存储系统来说,还真不如把所有数据都存在硬盘上。

ILM见鬼之五:中国鬼不是GHOST
分层存储厂商最喜欢说的事情就是国外有规定,某些Email数据必须有几年的存放时间,否则不合法。正是这样的法规使得存储和分层存储变得非常重要。但是中国要出台这样的政策好象还遥遥无期,连出台这样政策的基础都没有。自然不能套用了。据说药厂审批新药的数据比较繁多,采用分层存储应该效果不错,不过估计这阵子审批新药也不敢太多了,又少了一个买家。

看了以上五点,ILM是不是该见见鬼还是由你决定,存储很简单,只是大数量存储变得稍微复杂一些,如果被新名词吓唬住可不是好事情。当然我们非常欢迎对ILM非常熟悉的家伙对我们的拙见提出意见。


存储很简单,新名词多了就难了。

本文转自驳客:站在真理的对面博客51CTO博客,原文链接http://blog.51cto.com/fangsheng111/3073如需转载请自行联系原作者


驳客

相关文章
报错:tk.mybatis.mapper.provider.EmptyProvider中缺少selectOne方法!
报错:tk.mybatis.mapper.provider.EmptyProvider中缺少selectOne方法!
307 0
|
数据安全/隐私保护 Docker 容器
厉害了,如何搭建一套自己的私有网盘?
本文教大家用docker搭建一款自己的私有网盘,教程给大家分享一下。 开源云盘选择 搭建前我仔细看了一下各个开源私有云盘的实现,有以下几种:
546 0
厉害了,如何搭建一套自己的私有网盘?
|
XML 存储 前端开发
想要制作沙盒游戏?那么这一款插件你一定不能错过(Unity3D)
今天给大家介绍一款简单而又强大的多人沙盒游戏开发插件VOXL。 VOXL是一款简单且易于理解的多重体素沙盒游戏,使用Unity的UNET网络系统开发。 由于服务器和客户端是一体的,所以我们不用再费心搭建服务器,会大大提高我们的开发效率。 VOXL目前只包含大约2500行干净、优雅和易于理解的源代码。
|
10月前
|
数据采集 小程序 API
通义千问Qwen2.5-Coder 全系列来咯!强大、多样、实用
千问团队开源了强大的 Qwen2.5-Coder 系列模型,涵盖 0.5B 到 32B 六种尺寸,旨在推动开放代码模型的发展。该系列模型在代码生成、修复和推理等方面表现出色,支持多种编程语言,并在多个基准测试中达到 SOTA 水平。此外,Qwen2.5-Coder 还提供了丰富的应用场景,如代码助手、Artifacts 和 Interpreter,满足不同开发者的需求。
3592 106
|
Java Apache
httpclient能不能改成长连接的连接池
【8月更文挑战第25天】httpclient能不能改成长连接的连接池
380 2
|
人工智能 自然语言处理 测试技术
「AIGC」 华为CodeArts Snap详解
**CodeArts Snap** 是华为的人工智能编程助手,它能自动生成代码、解释代码和创建测试用例。例如,在Python GCD函数场景中,它根据自然语言描述写出函数,解释`x, y = y, x % y`的辗转相除法原理,并生成单元测试以确保代码正确性。此工具提升开发效率,尤其对初学者是极好的学习资源。
456 0
「AIGC」 华为CodeArts Snap详解
|
数据库连接 数据库
深入理解单一职责原则(Single Responsibility principle )
深入理解单一职责原则(Single Responsibility principle )
314 0
|
数据采集 人工智能 数据可视化
【AI大模型应用开发】【LangChain系列】4. 从Chain到LCEL:探索和实战LangChain的巧妙设计
【AI大模型应用开发】【LangChain系列】4. 从Chain到LCEL:探索和实战LangChain的巧妙设计
191 0
|
对象存储 存储 分布式计算
JindoFS: 云上大数据的高性能数据湖存储方案
JindoFS 是EMR打造的高性能大数据存储服务,可以为不同的计算引擎提供不同的存储服务,可以根据应用的场景来选择不同的存储模式。在2019杭州云栖大会大数据生态专场,阿里巴巴计算平台事业部EMR团队技术专家殳鑫鑫和Intel大数据团队软件开发经理徐铖共同向大家分享了云上大数据的高性能数据湖存储方案JindoFS的产生背景、架构以及与Intel DCPM的性能评测。
16649 58
JindoFS: 云上大数据的高性能数据湖存储方案
|
编解码 并行计算 Linux
CentOS安装NVIDIA Video Codec SDK
CentOS安装NVIDIA Video Codec SDK
400 0