调查结果:企业用户如何运用大数据技术?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:   目前围绕大数据技术所展开的宣传炒作可谓一浪高过一浪,而由此推动的消费增长也堪称一波未平一波又起。 据IDC预计,到2017年,大数据技术与服务市场的年复合增长率将达到27%,届时整体市场规模也增长至324亿美元。


 

目前围绕大数据技术所展开的宣传炒作可谓一浪高过一浪,而由此推动的消费增长也堪称一波未平一波又起。
据IDC预计,到2017年,大数据技术与服务市场的年复合增长率将达到27%,届时整体市场规模也增长至324亿美元。根据IDC的说法,为了帮助大家更为直观地进行比较,大数据市场的增长速度比信息及通信技术市场的整体增幅高出六倍。

 

尽管资金在不断涌入,但企业花掉的真金白银到底能不能买回个光明的未来还真说不准——毕竟目前尚处于大数据技术部署的早期阶段。为了找到确切答案,研究人员们调查了多位IT高管及中层管理人员,旨在了解他们所在企业在大数据领域的计划、投资以及发展倾向等情况。

 

以下是2014年大数据调查的一部分关键性结论:

这项调查所涉及的各企业分别处于大数据部署的不同阶段。其中一些已经完成了实施工作(19%),也有一些尚处于大数据项目的实施过程之中(25%)。其它不少企业则正在制定部署规划——具体时间为未来12个月之内(16%)或者未来13到24个月之内(16%)。最后剩下的这部分企业(23%)距离大数据项目的实施目标似乎还有很长的道路要走,他们往往还在纠结于寻找正确的执行策略或者解决方案。

 

从宏观前景角度看,大数据对于任何行业、任何规模的企业而言都具备极其重要的意义。在被问及企业为大数据规划制定的重要级别时,53%的受访者表示他们的项目处于关键性或者高优先级地位,另有34%的受访者表示属于中等优先级别。只有12%的受访者将其划入低优先级范畴。


  下面我们概括归纳受访者们对于大数据的观点:

  1.企业希望更好也更快地作出决策。

  为什么要选择大数据?因为它在帮助企业快速制定高质量决策方面扮演着关键性角色。在促使企业向大数据项目投入资金方面,有两点因素最为重要,它们分别是改进决策质量(受到59%受访者的认同)以及提高决策速度(受到53%受访者的认同)。

  在大数据作用目标排名当中,紧随以上两点之后的是改进规划与预测(47%)、开发新产品/服务以及收来源(47%)、改进新客户吸纳/现有客户保留情况(44%)以及建立新的业务合作关系(34%)。

  2.数据量达到PB级别?更多大型企业面临数据爆炸这一现实问题

  企业在运营过程中积累下与客户及业务发展相关的庞大数据集。在全部受访者当中,当前正在管理的平均数据规模已经达到了164TB。在被问及预计从现在起未来12到18个月内所需管理的数据总量时,受访者给出的平均答案为289TB——增长幅度高达76%。

  就目前来看,已经有6%的受访者在管理着数量超过1PB的庞大数据;而在接下来的十二到十八个月内,这部分受访者的比例将上升至14%。而在规模最大的企业当中(即年营收数额至少达到10亿美元),有31%的受访者预计需要管理的数据量将超过1PB。

  3.企业感受到数据超载所引发的后果。

  面对当前大量数据持续涌入的状况,企业也开始体会到由此带来的负面结果。举例来说:由于无法迅速找到所需信息而错失业务(31%的受访者表示此类情况偶尔发生、11%的受访者则表示经常发生);无法及时作出重要决策(39%的受访者表示此类情况偶尔发生、14%的受访者表示经常发生);用户反映数据量过大而不堪重负(46%的受访者表示偶尔发生、19%则表示经常发生);数据安全性方面也可能出现问题(46%的受访者表示偶尔发生、19%则表示经常发生)。

 

  4.企业准备投资,而投资回报率目前也不再是主要障碍。

  调查发现,大数据推广所面临的最大挑战在于日益紧迫的预算。在受访者当中,投资数额存在着一定差别。在低端层面,19%的受访者表示将在未来一年中向大数据项目投入10万美元以下的资金。而在高端层面,有29%的受访者表示将在大数据领域投入100万美元以上(其中更有2%的受访者计划投入1亿美元甚至更高额度的资金)。

  相关资金会花在与大数据相关的各个投入项目,其中包括:

  ●开发或者购买软件应用程序(38%);

  ●用于添加额外的服务器或者存储硬件/软件(37%);

  ●采用开源软件框架(例如Apache Hadoop)(30%);

  ●迁移到基于云环境的存储服务(28%);

  ●增加网络带宽(27%);

  ●迁移到基于云环境的分析服务(26%)。

  然而,尽管预算成为最普遍的难题,但投资回报率方面所并没有带来什么压力。只有26%的受访者认为当前投资的主要阻碍在于很难证明大数据项目带来投资回报的能力。

  5.企业面临人才短缺的困境。

  企业担心在内部环境中找不到有能力负责大数据相关事务的人才——譬如知识员工以及数据科学家——这就导致大数据计划很可能无法得到充分利用。在人员方面,34%的受访企业目前正在招聘拥有分析技能的人才、26%则选择将这部分工作外包给大数据专业服务供应商。

  在被问及未来十二到十八个月内计划添加哪些技术人员组合时,数据科学家(27%)名列榜首,接下来依次为:数据架构师(24%)、数据分析师(24%)、数据可视化专家(23%)、业务分析师(21%)、研究分析师(21%)、分析主管或者经理(19%)以及数据库程序员(19%)。

  6.数据安全成为关注重点,但并非最紧要的问题。

  根据此次调查,预算有限与人才稀缺并列成为大数据挑战当中最为紧迫的两大难题。此外,受访者们同样关注安全问题(35%)、开发时间(35%)、遗留问题——例如现有工具的整合(33%)、糟糕的数据质量(32%)以及数据实时整合或者分析难题(30%)。

  在谈到安全话题时,接近一半的受访者(49%)表示他们的现有安全解决方案及产品足以保障大数据项目的安全。29%的受访者表示现有机制还不够可靠,而另外22%则表示对此无法确定。

  7.哪个难题更令人头痛:业务整合还是文化接纳?

  研究人员向受访者们询问了他们在将大数据规划融入企业业务流程及文化中时所遭遇的挑战。通过选择“极具挑战性”和“颇具挑战性”答案的受访者比例,我们发现文化整合(54%)以微弱的得票数优势压倒了业务流程整合(50%),从而在这场并不光荣的比拼中胜出。

  8. IT主导大数据规划,但成功与否却取决于跨职能合作关系。

  在受访者当中,大数据项目由IT部门主导已经成为普遍作法:46%的受访者表示企业中是由高级或者高层IT管理者来统领大数据规划,而44%的受访者表示由IT管理者负责大数据项目的运作。不过后者的答案也并非如此单纯:其中36%的受访者指出高层业务领导者同样会参与进来。另外,受访者们表示他们的大数据项目得到了CEO(47%)或者LOB级别的支持与赞助。IT与业务部门负责人都认为大数据项目在由双方共同拥有并实施时,解决特定业务挑战的效果最为出色。

  9.大数据发展势头在多数企业中仍将持续。

  展望未来,接近一半(48%)的受访者认为未来三年大数据在使用率方面将普及到企业的每个角落,但另外26%的受访者则表示大数据最终的覆盖范畴只能达到一个或者多个业务单位、部门或者分支机构。只有5%的受访者预计大数据会在这股炒作风潮平息后被打入冷宫,而另外5%表示不能确定。其余的16%受访者认为大数据将继续作为实验性技术存在,但不会出现在主流产品当中。


原文发布时间为:2014-03-23


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
26天前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
117 4
|
2月前
|
存储 分布式计算 Hadoop
Hadoop框架解析:大数据处理的核心技术
组件是对数据和方法的封装,从用户角度看是实现特定功能的独立黑盒子,能够有效完成任务。组件,也常被称作封装体,是对数据和方法的简洁封装形式。从用户的角度来看,它就像是一个实现了特定功能的黑盒子,具备输入和输出接口,能够独立完成某些任务。
|
1月前
|
SQL 分布式计算 大数据
我与ODPS的十年技术共生之路
ODPS十年相伴,从初识的分布式计算到共生进化,突破架构边界,推动数据价值深挖。其湖仓一体、隐私计算与Serverless能力,助力企业降本增效,赋能政务与商业场景,成为数字化转型的“数字神经系统”。
|
1月前
|
存储 供应链 数据可视化
Java 大视界 -- 基于 Java 的大数据可视化在企业供应链风险预警与决策支持中的应用(204)
本篇文章探讨了基于 Java 的大数据可视化技术在企业供应链风险预警与决策支持中的深度应用。文章系统介绍了从数据采集、存储、处理到可视化呈现的完整技术方案,结合供应链风险预警与决策支持的实际案例,展示了 Java 大数据技术如何助力企业实现高效、智能的供应链管理。
|
2月前
|
数据采集 自然语言处理 分布式计算
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
|
2月前
|
存储 分布式计算 算法
Java 大视界 -- Java 大数据在智能教育在线考试监考与作弊检测中的技术创新(193)
本文探讨了Java大数据技术在智能教育在线考试监考与作弊检测中的创新应用。随着在线考试的普及,作弊问题日益突出,传统监考方式难以应对。通过Java大数据技术,可实现考生行为分析、图像识别等多维度监控,提升作弊检测的准确性与效率。结合Hadoop与Spark等技术,系统能实时处理海量数据,构建智能监考体系,保障考试公平性,推动教育评价体系的数字化转型。
|
2月前
|
SQL 缓存 监控
大数据之路:阿里巴巴大数据实践——实时技术与数据服务
实时技术通过流式架构实现数据的实时采集、处理与存储,支持高并发、低延迟的数据服务。架构涵盖数据分层、多流关联,结合Flink、Kafka等技术实现高效流计算。数据服务提供统一接口,支持SQL查询、数据推送与定时任务,保障数据实时性与可靠性。
|
4月前
|
数据采集 人工智能 大数据
大数据+商业智能=精准决策,企业的秘密武器
大数据+商业智能=精准决策,企业的秘密武器
161 27
|
6月前
|
存储 分布式计算 Hadoop
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
279 79
|
4月前
|
人工智能 分布式计算 大数据
MCP、MaxFrame与大数据技术全景解析
本文介绍了 MCP 协议、MaxFrame 分布式计算框架以及大数据基础设施建设的相关内容。MCP(Model Context Protocol)是一种开源协议,旨在解决 AI 大模型与外部数据源及工具的集成问题,被比喻为大模型的“USB 接口”,通过统一交互方式降低开发复杂度。其核心架构包括 Client、Server、Tool 和 Schema 四个关键概念,并在百炼平台中得到实践应用。MaxFrame 是基于 Python 的高性能分布式计算引擎,支持多模态数据处理与 AI 集成,结合 MaxCompute 提供端到端的数据处理能力。

热门文章

最新文章