大数据近在眼前:如何更加有效的管理?

简介:

本文讲的是大数据近在眼前:如何更加有效的管理,您企业的业务开展是否依赖于您的数据?如果是这样,您如何能够更好的利用这些数据信息呢?

  根据赛门铁克的一份最新调研报告显示,今天,所有企业的信息存储总量已达2.2zettabytes。平均而言,每家企业均有100,000万亿字节的数据信息。而中小型企业平均信息存储量为563万亿字节。此外,预计这一数字将在未来的一年增长67%,而中小型企业的信息存储量将增长178%。

  这些数字大得很难想象。那么试试这个:10KB大约相当于一张填满了文本的单页纸。如果你是采用叠纸的方法,1百万TB的堆栈,纸张叠起来大约相当于帝国大厦一样高(1,454英尺)。而2.2zettabytes的数据,则足以相当于1287幢帝国大厦那么高的纸张堆叠起来,可以达到约374英里。

  “信息变得如此重要。”赛门铁克信息管理集团高级副总裁总裁CJ·德赛说。“信息的增长非常迅速。企业需要有十足的把握这些数据是怎样如何增长、在哪里增长、以及为什么增长。”

  德赛指出,一位具有20年金融服务公司IT经理从业经验的老将表示,较之20世纪90年代,现在他每天要增加更多的数据到数据中心

  企业每年在数据方面花费3800万美元

  企业需要了解他们的信息增长的原因是相当明确的,德赛说:“现在,在全球范围内每年在业务信息方面的花费达1.1兆美元。也就是说,大型企业平均每年要花费3800万美元用于数据信息存储处理。而中小企业平均花费332000美元,根据赛门铁克的报告显示。”

  今天,企业产生的大量的信息,可以帮助他们更好地服务他们的客户,并提高生产力。“赛门铁克集团产品和服务副总裁弗兰西斯德苏莎表示。”然而,同样的信息,如果没有适当的保护,也可以成为重大的企业责任。那些能够有效地利用他们的数据信息的企业较之不能有效利用的企业将具有更多的主要竞争优势。甚至在某些情况下,带来成功与失败的差别。随着数据信息价值的增加和成本的上升,成功的企业将找到如何更有效地保护他们的数据信息,并释放出更多的生产力。

  受访者表示,平均而言,数据信息代表他们所在企业49%的价值。这意味着,数据信息的丢失可能造成客户流失、企业品牌受损、收入减少、以及相关费用的增加,其带来的恶果可能是灾难性的。

  “由企业表示,数据信息几乎是其企业价值的一半。”德赛说。“他们所有的IP都是在他们的数据信息中。如果基于一些自然灾害或机器故障的原因,这些数据信息丢失,你没有就没有恢复的机会。”

  企业仍然在积极努力的获取数据

  然而,尽管企业存储这些数据存在一定的风险。赛门铁克发现在过去的12个月:

  69%的企业由于人为错误、硬件故障、软件故障和移动设备丢失或被盗等原因,丢失了重要的商业信息

  69%的企业曾暴露过企业的机密信息

  31%的企业未遵守相关规定

  当涉及到机密信息和未遵守相关规定,其中最为突出的一点便是信息蔓延。30%的受访者表示,信息蔓延或是引发事故的重要因素。”我们对于IT信息最大的关注在于其对信息的控制能力,能够真正规范的了解我们自身。“一位就职于某大型金融服务企业的IT经理表示。”我们有如此众多的信息,很难把他们集中在一起。毕竟在金融业界,有着各种不同的规定,这使得数据信息的集中变得非常困难。“

  德赛说,事实上,企业存储的数据中,有多达42%的数据信息重复的,这些信息数据存储在文件共享、备份在台式机上、附着在一封电子邮件的附件中或是复制到移动设备中。

  鉴于信息量的日益膨胀以及如果不保护好这些数据信息,其潜在危险的不断增加,企业应该如何处理好这些数据信息呢?

  “你必须专注于数据信息的管理,而不是存储设备或数据中心。”德赛说。“跟踪您的信息流。你在哪里存储信息?你是否追踪你的敏感信息?”

  五步助您更好地管理大数据

  如下有五大步骤,可以帮助您更好地管理您的数据:

  专注于信息,而不是设备或数据中心。重点建设信息基础设施,优化您的企业查找、访问和使用关键业务信息的能力。关键技术包括采用虚拟化技术、云计算和移动设备和应用。

  获得完整的认识。充分了解您的数据信息,并承认并非所有的信息都是同等重要的。许多企业缺乏基本知识,诸如那些部门拥有特定的信息、相关数据的重要性程度,甚至无法辨别相关数据信息是属于私人数据或是业务数据。你需要映射和分类信息,发现其相对价值。一旦你这样做了,你可以更容易地优先开始考虑真正重要的信息安全,保护和管理资源。

  保证数据信息的有效性。使用重复数据删除和归档技术来保护更重要的信息,同时存储更少的信息。这意味着,只存储你真正需要的数据信息。

  设置一致的政策。这是必须基本一致的政策信息,即无论信息存储在何处,无论其是在物理环境,虚拟环境或云环境中,都必须强制执行一贯政策。统一信息分类,自动发现拥有数据信息的部门和使用的具体信息,访问控制和分配,自动信息保留和删除,并加速电子发现的过程。

作者: 申安安 

来源: IT168

原文标题:大数据近在眼前:如何更加有效的管理?

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
SQL 分布式计算 MaxCompute
maxcompute之配置报错如何解决
MaxCompute配置是指在使用阿里云MaxCompute服务时对项目设置、计算资源、存储空间等进行的各项调整;本合集将提供MaxCompute配置的指南和建议,帮助用户根据数据处理需求优化其MaxCompute环境。
33 0
|
7月前
|
存储 分布式计算 关系型数据库
大数据Spark偏移量管理
大数据Spark偏移量管理
33 1
|
4月前
|
安全 大数据 API
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
62 0
|
6月前
|
分布式计算 运维 监控
DataWorks如何配置MaxCompute监控进行订阅管理?
DataWorks如何配置MaxCompute监控进行订阅管理?
41 1
|
4月前
|
监控 数据可视化 安全
Java智慧工地管理平台可视化大数据建造工地APP源码
Java智慧工地管理平台可视化大数据建造工地APP源码
58 0
|
4月前
|
人工智能 监控 Java
Java数字化智慧工地管理云平台源码(人工智能、物联网、大数据)
Java数字化智慧工地管理云平台源码(人工智能、物联网、大数据)
79 0
|
7月前
|
存储 消息中间件 大数据
大数据Flink状态管理
大数据Flink状态管理
33 0
|
12月前
|
小程序 Java 人机交互
智慧校园大数据云平台源码,实现基础数据共享、应用统一管理
智慧校园云平台电子班牌系统,利用先进的云计算技术,将教育信息化资源和教学管理系统进行有效整合,实现基础数据共享、应用统一管理。借助全新的智能交互识别终端和移动化教育管理系统,以考勤、课表、通知、家校互通等功能为切入点,从班级建设、校园文化、班级文化、学生工作、信息发布、家校共育六大方面,着力打造满足用户场景,深度贴合学校教育的改革需求。
|
分布式计算 MaxCompute 数据安全/隐私保护
《MaxCompute技术公开课第四季 之 MaxCompute数据安全管理解析》电子版地址
MaxCompute技术公开课第四季 之 MaxCompute数据安全管理解析
《MaxCompute技术公开课第四季 之 MaxCompute数据安全管理解析》电子版地址
|
存储 分布式计算 关系型数据库
大数据的存储和管理(二)|学习笔记
快速学习大数据的存储和管理(二)
143 0
大数据的存储和管理(二)|学习笔记