十一大市场发展趋势主导高级分析走向-阿里云开发者社区

开发者社区> 大数据文摘> 正文
登录阅读全文

十一大市场发展趋势主导高级分析走向

简介:

0.jpg

在今天的商务环境当中,企业正越来越多地向高级分析机制伸出求助之手,希望借此从规模更庞大且各类愈发繁杂的数据中汇总出指导性意见,进而找到可行模式、异常情况与可预测结果。


“我们的研究结果清晰地表明,高级分析正在迅速成为企业运营与决策制定流程中的组成部分,而且其影响范围几乎涵盖了所有产业门类,”研究企业Hurwitz & Associates公司COO兼首席分析师Marcia Kaufman与高级分析师Daniel Kirsch在最近发布的《高级分析:2014年Hurwitz成功指数报告》当中写道。“企业单单了解过去曾经发生了什么已经远远不够,他们还需要掌握发生将要发生哪些变动,并通过趋势预测采取行动、最终实现业务成果优化。”


举例来说,某家药店目前正利用高级分析来帮助他们提前六个月预测流感季或者过敏季的确切影响范围,从而使其更为有效地控制对应药物库存量,保证货品既不致短缺又不会积压——空出来的宝贵货架空间则可被用于摆放其它商品。


农场则利用高级分析机制预测何时播种、如何优化农作物产量以及何时着手采摘。设备制造商们利用高级分析机制预测生产线上的哪台产品将会出现故障,这样他们就能在计划外停机事件发生之前进行预防性的维护工作。


金融服务企业利用这项技术应对内部与外部欺诈行为。专业运动团队则利用这项技术处理各种各样的常见问题,包括利用运动员身上的传感器制定优化训练方针并预测可能出现的身体损伤。可以说高级分析方案的适用性是永无止境的。


“我们真正致力于实现的其实是预测消费者的行为模式,”Kirsch表示。“企业用户希望有能力提供更具个性化的方案:花钱购买三件汗衫本身并没什么出彩,但如果厂商能够同时允许这部分用户以七折价格加购一包短裤的话,相信很多朋友一定会动心。作为普通消费者,如果能获得这样独特的服务内容,我们应该会对厂商产生强烈的好感。”


目前高级分析领域正在迅速发展,旨在满足企业用户不断变化的实际需求,Kirsch解释道。下面将要介绍的十一大市场发展趋势,正是Hurwitz & Associates公司通过观察总结出的、将主导高级分析未来走向的重要因素。


1.客户希望能将硬件与软件整合起来以处理分析工作负载


高级分析客户们正积极找寻能够通过预集成以及优化方式运行高级分析工作负载的硬件,而这也给了SAP、IBM以及SAS等传统供应商涉足这一市场的好机会。在报告中,Kaufman与Kirsch指出,这些硬件产品允许用户在扩展对大数据及高级分析负载支持能力的同时,继续保有出色的速度与可靠性表现。


“SAP打造的内存内平台HANA允许客户与合作伙伴将专门为高速与大规模分析负载设计的InfiniteSight运行在自有硬件之上,”他们写道。“除此之外,IBM的PureData System则是一套专门针对运营分析工作负载设计并优化的集成系统。客户能够在它的帮助下享受更为出色的可靠性、可扩展性以及集成系统SAS所带来的卓越处理速度——这要归功于IBM与数据库开发商Teradata共同合作所打造出的这套预集成与优化平台。”


2.供应商将垂直与水平用例打包提供


Kirsch指出,客户正越来越多地将目光投向终端到终端垂直或者水平解决方案,而供应商也在积极据此拿出有针对性的技术成果,其垂直行业涵盖对象包括医疗、金融乃至政府事务部门。水平方案组合则包括客户服务、客户流失控制以及欺诈活动预防等等。


“这些解决方案中已经预告集成了最佳实践、数据准备自动化以及自动模式创建等机制,但同时也允许使用者对其进行一定程度的定制,”Kaufman与Kirsch解释道。“举例来讲,SAS的客户智能平台就为客户提供了一系列工具,旨在为其提供个性化使用体验;而Pega则专注于为SAP及salesforce.com产品带来扩展功能。Pega的产品允许客户以特定数据源为基础,运行业务流程管理(简称冠BPM)与客户关系管理(简称CRM)分析任务。”


3.开源编程语言R正愈发普及


作为一种专门面向计算编译、虚拟化与数据的开源编程语言,R语言正逐步成为高级分析产品当中不可替代的必要工具。


Kirsch指出,几乎每一家顶级高级分析方案供应商都已经将R语言集成到了自己的产品当中,并借此获得了将R模型导入其中的能力。在这种情况下,数据科学家、统计学家以及其他高级企业用户得以在自己的分析方案包中自由使用R语言。


Kirsch同时表示,这一趋势当中最大的受益者当数Revolution Analytics公司——这是一家专门为R语言提供企业级支持服务的领先供应商。Kaufman与Kirsch还提到了高级分析企业Predixion公司,其关注重点在于将R语言由原本的数据科学家与统计学家群体推广至规模更大的企业用户领域——他们利用一套向导界面实现了这一目标。


4. Python为通用型程序员打开了一道通往高级分析的大门


R语言通常只适用于那些有能力利用高深数据分析与机器学习技术自行开发复杂分析模型的数据科学家,而开源语言Python则允许更为广泛的通用型程序员们加入到高级分析领域中来。


“尽管Python并不像R语言那样具备精妙的深度数据分析与机器学习能力,但其社区正努力开发出更有针对性的高级分析相关功能,”Kaufman与Kirsch指出。“IBM与SAS都允许客户将R与Python语言集成在大型项目当中。”


5.可视化界面帮助企业用户获得更具可访问性的高级分析方案


数据科学家这一群体毕竟较小、与普通用户的距离也较为遥远,相比之下中小型企业往往仍在为创建具备丰富经验的分析团队而头痛不已——可以理解,毕竟紧张的预算使其很难具备充分的发挥空间。与此同时,分析机制则在企业的各个决策层面扮演重要角色,从而进一步增加了企业用户对访问数据分析结论能力的渴求。有鉴于此,高级分析供应商们纷纷将注意力集中在相关功能身上,希望自己的平台能够尽可能方便企业用户的实际应用。


“举例来说,SAP正努力将预测流程推向自动化,同时Angoss也为决策与策略树打造出一套极具可视化特性的界面方案,”Kaufman与Kirsch在报告中写道。“SAS与IBM都已经针对企业用户发布了特定产品。举例来说,SAS的Visual Analytics方案与IBM的Analytics Catalyst都专门为企业用户而生。”


6.实时数据流与物联网炙手可热


随着越来越多设备开始接入互联网,对于实时数据流的分析需求也在迅速增长。通过将高级分析与流数据相结合,企业能够作出更具敏捷性的响应,从而为网络购物客户提供更具个性化的推荐商品清单或者在维修人员注意到之前全程监控喷气发动机中有可能引发故障的各关键性指标。


“从传统角度讲,航空公司在处理这方面工作时主要依靠手动设置阈值以及直观检查,”Kaufman与Kirsch表示。“这些阈值设定可能会在引擎过热时发出警报,但却无法确定几种通常无害的因素结合起来有可能引发怎样的潜在危害。供应商对这类需求作出响应,拿出了能够处理实时数据的分析方案。SAS的事件流处理引擎与IBM的InfoSphere Streams允许用户在数据使用过程中对其加以分析。”


7.数据可视化已经成为一种业务需求


数据可视化在企业当中的重要地位正不断提升,这是因为企业用户如今几乎被流数据、社交媒体数据、机器数据以及其它大规模结构化、半结构化乃至非结构化数据所淹没。可视化能够有效帮助分析师们从纷繁复杂的信息当中提取有价值结论,这一点是传统数据列表、电子表格以及图表所无法实现的。


“可视化可能会成为企业用户处理数据信息的主要界面,甚至作为数据科学家迈出第一步的基础平台,”Kafuman与Kirsch表示。“为了帮助企业用户与数据科学家弥合二者之间的显著差异,供应商们开始在产品中添加丰富的可视化功能。可视化功能可以根据不同用户群体加以定制,从而帮助对方更为便捷地对内容进行理解。某些供应商甚至推出了一系列更为复杂的可视化产品。举例来说,SAS也拥有自己的内存内交互式可视化工具,也就是SAS Visual Analytics。IBM的快速自适应可视化引擎(简称RAVE)则以SPSS Analytic Catalyst为基础,旨在帮助用户根据数据集获取可视化建议。其它供应商,包括Megaputer、RapidMiner以及SataSoft等等,也都将可视化功能添加到了自己的核心产品当中。”


8.企业将大数据分析引入到全部决策制定活动当中


仅仅借助统计或者数据分析部门的支持已经不足以科学有效地完成分析工作并发挥其潜力。企业希望能将分析机制作为决策制定流程的组成部分,并将其推广到各个职能部门当中,包括市场推广、销售、运营、财务以及人力资源等等。


“为了在上述职能区划中改进客户激励与结果优化机制,企业希望能将更多不同类型的数据纳入到分析范畴中来,”Kaufman与Kirsch指出。“举例来说,数据类型的范围包括机器生成、其它传感器数据、移动与财务反馈数据甚至是社交媒体数据,这一切都将被作为大数据分析对象。这些企业希望解决方案供应商支持规模更为庞大的数据集。”


供应商们的应对方式是利用综合性平台帮助用户将大数据分析与贯穿企业各个部门的分析事务结合起来。Kirsch指出,IBM的SPSS分析服务器就是其中的典型代表,它能帮助企业用户更快地获取到大数据预测性分析结果。


9.分析服务逐渐由云端负责托管


高级分析供应商们开始越来越多地以云作为载体,旨在为用户提供更具成本优势的分析功能。这样一来,那些以往负担不起复杂内部解决方案带来的高昂支出的企业也开始享受到分析服务带来的收益。


“其中一部分产品专门针对特定用例所打造,”Kaufman与Kirsch在报告中提到。“举例来说,Angoss、Pega与SAP都通过AppExchange对CRM数据进行分析,从而提供salesforce.com应用程序。Angoss、IBM与SAS则带来了更为灵活的软件即服务产品,允许客户利用基于云的软件方案处理通用型分析任务。”


10.利用数据库内分析解决ETL(即提取、转换与加载)挑战


性能、数据管理与安全性是用户在对大规模数据集进行高级分析时难以回避的三大严峻挑战。数据库内分析的出现有效缓和了这些挑战,让用户得以亲自在数据库内部署自己的分析模型、从而免去了将数据移动至分析环境这一复杂流程。通过对内部数据进行分析,用户们能够在体验性能与效率提升之外简化安全保障与数据管理工作,这是因为数据对象从来没有离开过安全数据库半步。


“很多供应商已经开始提供面向多种数据平台的数据库内功能,其中自然包括Hadoop,”Kaufman与Kirsch指出。“IBM、SAS、RapidMiner、Revolution Analytics、Predixion、StatSoft、SAS以及Angoss都支持数据库内数据挖掘技术。在根据数据库内功能评估供应商技术实力时,很重要的一点在于了解对方是否能够支持企业目前正在使用的数据平台。某些供应商只支持Hadoop,但也有不少供应商能够支持几乎全部常见数据平台。”


11.企业向预测模型标记语言(简称PMML)伸出橄榄枝


随着更多企业由指分析转向利用实时反馈获取结论、从而不断改进自己的模型精确度,他们也在越来越多地使用预测模型标记语言(简称PMML)。PMML是统计与数据挖掘模型的一种执行标准,由Data Mining Group(简称DMG)所开发——而DMG属于独立于供应商之外、保持中立态度的技术组织。IBM与SAS都是DMG的正式会员,此外SAP、StatSoft、RapidMiner以及Angoss也都为PMML的开发作出了贡献。Kirsch指出,这套标准使用户能够更加轻松地利用特定应用程序为特定系统开发出模型,并在需要时利用另一种应用程序将其部署到其它不同系统之上。


“企业用户们发现利用PMML将模型部署在应用程序当中有助于克服延时,并能让模型更加高效快速地参与到生产流程当中,”Kaufman与Kirsch表示。“使用PMML的最大优势在于,它能够消除定制化编码与专有处理流程所带来的高成本与大量时间投入。”


原文发布时间为:2014-07-31

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: