没有数据驱动文化 大数据项目将失败

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

寻求大数据项目的成功?记住:文化为王。

Tara Paider,是位于俄亥俄州哥伦布市,Nationwide Insurance公司的IT架构的副总裁,对于数据专家渴望获得大数据项目的成功,给出了一些建议:大数据项目失败的最大原因之一,既不是技术,也不是数据的数量。而是人。

例证:Nationwide的保险代理人的日常工作的一部分,是确保保费上升时,客户不转换到其他保险公司。有一个列表,列出保费将在未来30天内上升的客户,代理拿起电话,与他们最好的客户解释这些变化。一项新客户数据分析项目发现,这样做有时会有负面作用:这些电话并不能帮助代理保住那些保费变化的客户,实际上会造成客户流失,Paider说。

“对于代理,很难理解数据发现的结果,因为和他们过去20年所做的不同,”她对在拉斯维加斯参加Gartner Business Intelligence and Analytics的与会者说。

所以,Paider和她的团队开始制作更精细的保费通知列表,让代理只给会带来积极响应的客户打电话和接触,她说。 这个故事和CIO这个职位本身一样古老。ERP整合项目经常失败,并不是因为技术,而是因为人。

大数据,也没有什么不同。但是大数据正在颠覆业务流程工作流;它对所有都有影响,从企业基础设施,到企业架构。为了确保员工为数据感到兴奋,而不是感到威胁,专家常常告诫公司,他们需要创建一个数据驱动的文化。

但这说起来容易,做起来难。 Paider指出,一个强大的企业文化——要从高层开始,但不止于此;它还需要一线员工的参与,但是会带来额外的障碍。 “这是最难的部分,而我们在过去20年或30年都是这样做的,我们很清楚。这是我们最大的挑战,”她说。

打造数据驱动的文化

Paider的观点并不罕见。 PricewaterhouseCoopers的研究指出文化,错误的文化是阻碍企业利用数据,并在信息时代取得成功的三大障碍之一。这一研究,与Iron Mountain合作完成,发现四分之三的企业中没有从他们的数据中获益。

公司如何打造数据驱动的文化环境?Gartner给出的定义是:“企业使用数据来组织活动,做出决策和解决冲突”。在Nationwide,是任命一名首席数据官(CDO),Paider向其汇报。 “任命CDO,是好消息,我们希望利用数据来作出决定,”她说。“我不认为这是改变文化的唯一方法,但你需要一些能够在业务和IT数据上有发言权的人,从而做出正确的决定。”

Nationwide的另一项文化修正,是向业务开放数据。新的,非结构化的数据源,比如地理位置,语音,社交媒体数据,可以更深入的了解客户的行为,获取更多的机会,更好的去服务客户。为了帮助业务获得这些洞察力,IT部门需要在大数据技术上进行投入,并承诺让业务部门访问这些数据。“传统上,我们认为数据项目是线性的,类似应用开发项目,”Paider说。“但是,数据项目很复杂,你根本不知道会从数据中发现什么…直到你开始接触这些数据。”

在另一家数据驱动的企业内,开放公司数据对于打造大数据文化也是关键。Jeremy King,是位于加州圣布鲁诺的@WalmartLabs 的CTO和主管,说他的团队将数据集中到一个Hadoop系统,让他们的内部客户访问其所需的数据,来进行实验。在提供访问权限前,King的团队构建进程,以清洗和标记数据以保护个人认证信息。

但是,公司还需要消除官僚壁垒,让访问数据变得容易,有些企业则选择逃避。“我和很多企业进行过交谈,已经建立了Hadoop 或大数据架构,但是他们却不让任何人访问这些系统,”他在去年秋天的Strata + Hadoop World上说到。 这种繁文缛节限制了创造性思维和实验,King说。在Walmart,甚至提供部分数据的权限,也是被限制的。

“如果你只使用部分的数据,你将很难做出决定,在Walmart这样规模的公司内,是否起作用。所以我们希望每个人从一开始都能够访问数据,来测试他们的理论,”他说。 授予整个匿名数据集的访问权限起到了效果。至少在一个案例中,这样做促使了一个类似初创的时刻,在几个小时内,两个工程师设计并开发了广告优化平台的原型,将在线广告和线下销售相连接。这一原型最终成为Walmart Exchange。 “我认为,除非你有让所有人访问数据的系统,这些神奇的时刻是不会发生的,” King说。

如何构建数据驱动的文化

开始建立一个数据驱动的文化,CIO们必须找到令人信服的业务用例。Micheline Casey,美联储的前任首席数据官,现在为大数据分析公司Clear Story Data担任顾问,曾经经历过对于大数据项目的阻力,不是因为缺乏兴趣或支持,但因为更务实的理由:钱。“美联储是一个政府机构,它虽然不从国会拿钱,但它有预算,”她说。预算很小,造成资金的争夺。

“特别是刚接触大数据的公司,要识别和优先选择正确的项目和用例,展现价值,在企业内建立信誉,”她说。“在很多企业中,这种信誉帮助你获得资金。” 这就是为什么专家们,包括Mann,建议通过解决一个小问题,将大数据引入企业。“你想要找到一个可以成为范例的案例,” Mann说。

“你有一个非常具体的问题,你对于这个问题,有个非常实用的解决方案。” 随着企业看到问题快速解决,对于这种方法的信任会增长——随着文化变得越来越数据驱动,IT的战略也会随之改变。在Bloomberg,例如,对于大数据价值的讨论已经结束了。现在的挑战是确定在机器学习和大数据平台上需要构建什么。 “你必须确保你密切与产品相关,你构建的是通用系统,而不是针对小问题的特定方案,因为这个小问题可能会发生变化,” Mann说。

原文发布时间为:2016年9月14日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
257 7
|
1月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
43 2
|
1月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
82 1
|
2月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
54 3
|
21天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
42 4
|
27天前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
24 4
|
1月前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
58 3
|
1月前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
66 2
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
102 2