成功实施大数据项目的五项基本要求

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

在Apache:北美大数据会议的主题演讲当中,拥有十余年从业经验的数据科学家Amy Gaskins谈到了她总结出的五项助力大数据项目成功或实现突破的要点。

成功的大数据项目拥有五大核心要求,拥有十余年从业经历的数据科学家Amy Gaskins强调称。

在此次Apache:北美大数据会议的主题演讲中,Gaskins提到了以下五项助力大数据项目成功或实现突破的要点:

认同 。目前的普遍共识在于,大数据项目需要获得高层管理团队的认同才有可能成功。不过Gaskins表示,单纯做到这一点还不够。大家需要立足各个层面给予认同,包括中层管理与员工自身。“大家需要自上而下团结一致。为什么要这样?因为每个人都需要理解大数据究竟是什么。”

紧迫性 。“如果不建立大数据项目,是否会导致自身业务面临实际威胁?”Gaskins提出设问。

透明度 。企业内部与外部人员是否了解我们在做些什么,又为什么这么做?具体作法能否复用?

非数据科学专业人员的参与 。所谓非数据科学专业人员,是指那些了解企业业务的专家。他们能够提供丰富的背景信息,帮助我们了解数据所表达的内容。Gaskins表示这些专家往往会将多个大数据项目加以结合,“非数据专业人士能够防止IT与业务部门爆发争端。”

心 理安全 。这里谈的是信任。各团队成员、数据科学家以及非数据专业人士之间必须彼此信任。

“在探讨成功条件时,我们应当参考马斯洛的需求层次结构,”Gaskins建议称。“事实上这是一套完整体系,而且可以对其进行细化拆分。”

两个大数据成功实例与一个险些失败的项目

Gaskins最近担任了某个国家海洋与大气管理局(简称NOAA)发起的大数据项目的主管,她用其中的三个实例进行具体讲解:帮助第43持续保障旅在阿富汗执行任务,以避免资源落入塔利班武装集团手中; 帮助MetLife公司迪拜办事处建立起保险欺诈检测机制; 帮助NOAA建立气象资料自动化解决方案并推动其商业化。

前两个项目完全满足以上五点要求,并最终取得了成功。

在阿富汗,Gaskins以军事情报官的身份担任美国陆军情报与安全司令部(简称INSCOM)指导员。在为第43持续保障旅服务时,仅有6名成员的情报部门需要支持旅内约5000名士兵。Gaskins建立的项目利用卡车司机及其他工作人员收集情报,从而分析资源分配过程中依法受贿的相关证据。

而在迪拜与MetLife的合作项目中,Gaskins帮助这家保险公司建立起自动化解决方案,并最终通过发现一系列欺诈行为实现了超过400%的投资回报。

第三个项目虽然取得了一定程度的成功,但却未能最终达到NOAA领导者的要求。其缺少紧迫性作为推动力。该项目确实成功将相当一部分NOAA数据交付给公众,但取得成功的企业客户往往需要借用甚至挖走NOAA内部非数据专业人士才能理解数据信息。

“好在我们的大数据项目团队不设明确的头衔,意味着每个人都能够轻松参与决策,”Gaskins表示。“我们一直保持着开放与透明的状态,而这也让整个团队相当稳固。”

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
167 4
|
4月前
|
SQL 分布式计算 大数据
别再迷信“上大数据就能飞”了!大数据项目成败的5个真相
别再迷信“上大数据就能飞”了!大数据项目成败的5个真相
116 6
|
4月前
|
JSON 分布式计算 大数据
springboot项目集成大数据第三方dolphinscheduler调度器
springboot项目集成大数据第三方dolphinscheduler调度器
275 3
|
分布式计算 大数据 Java
springboot项目集成大数据第三方dolphinscheduler调度器 执行/停止任务
springboot项目集成大数据第三方dolphinscheduler调度器 执行/停止任务
89 0
|
7月前
|
数据采集 分布式计算 数据可视化
大数据项目成功的秘诀——不只是技术,更是方法论!
大数据项目成功的秘诀——不只是技术,更是方法论!
199 8
大数据项目成功的秘诀——不只是技术,更是方法论!
|
数据采集 大数据
大数据实战项目之电商数仓(二)
大数据实战项目之电商数仓(二)
335 0
|
机器学习/深度学习 设计模式 人工智能
面向对象方法在AIGC和大数据集成项目中的应用
【8月更文第12天】随着人工智能生成内容(AIGC)和大数据技术的快速发展,企业面临着前所未有的挑战和机遇。AIGC技术能够自动产生高质量的内容,而大数据技术则能提供海量数据的支持,两者的结合为企业提供了强大的竞争优势。然而,要充分利用这些技术,就需要构建一个既能处理大规模数据又能高效集成机器学习模型的集成框架。面向对象编程(OOP)以其封装性、继承性和多态性等特点,在构建这样的复杂系统中扮演着至关重要的角色。
236 3
|
分布式计算 运维 DataWorks
MaxCompute操作报错合集之用户已在DataWorks项目中,并有项目的开发和运维权限,下载数据时遇到报错,该如何解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
222 8
|
弹性计算 分布式计算 大数据
MaxCompute产品使用合集之如何将用户A从项目空间A申请的表权限需要改为用户B
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
158 6
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何查询MaxCompute项目中的所有表及其字段信息
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

热门文章

最新文章