企业部署大数据分析项目成功的秘诀

简介:
本文讲的是 企业部署大数据分析项目成功的秘诀, 大数据不仅是一个流行话题,更是企业中实实在在存在的需求。许多企业开始着手于大数据分析项目,但在此之前,我们需要一个良好的部署方案以确保最终的结果能够为业务服务。选择合适的技术是规划的第一部分,当企业选择了数据库软件、分析工具以及相关的技术架构之后,我们就可以进行下一步并开发一个真正成功的大数据平台。

  当然,我们也没必要过分夸大项目管理进程的作用,成功的大数据分析项目来自于多个方面。在本文中,我们就将介绍五个技巧,企业用户进行平台部署的时候可以作为一定的参考:

  只选择你所需要的数据。出于其本身性质而言,大数据分析项目中我们会遇到海量的数据集。但是海量数据并不代表一个企业的所有数据,也不是相关数据源中的所有信息都需要我们来进行分析。企业需要确定哪些数据具有战略价值,能够为分析服务。举例来说,什么样的信息组合对于客户维系起到至关重要的作用?或者股票市场中,有哪些数据隐藏着交易的模式?在规划阶段,把注意力集中在业务目标之上,将有助于企业对分析进行精准的定位,在此基础之上我们可以也应该了解哪些数据能够满足这些业务目标。在一些情况下,包含所有数据的案例也会有,但毕竟还是少数。我们往往只需要大数据中的一个子集来进行分析。

  构建高效的业务角色然后处理相应的复杂度。积极应对复杂性是大数据分析项目成功的关键之一。为了能够最终得到正确的分析结果,我们需要让所有相关的业务数据所有者参与到流程当中,以确保提前制定必要的业务角色。一旦业务角色制定完毕,技术人员就可以评估相应的复杂度,以及所需要做的工作。这就指向了部署的下一个阶段。

  以协同的方式将业务角色转化为相关的分析。建立业务角色对于大数据分析应用来说只是第一步,接下来IT或者分析专家需要创建相应的算法。但这部分工作并不应该是独立的,起初的查询越准确,那么所需要的开发工作就越少。许多项目都需要持续反复的开发工作,究其原因还是因为项目执行人员和业务部门沟通出现了问题。因此,在项目开发的进程中,我们需要双发协同并及时沟通,以便保障项目的顺利进行。

  确定一个维护计划。除了项目之前的一些开发工作,我们还需要不间断地注意变更。在业务需求变化之上的日常查询维护固然重要,但毕竟它只是整个分析项目管理的一部分。随着数据集的不断增长以及业务用户对分析过程的不断熟悉,他们对系统的要求也会相应地增加。分析团队必须能够及时地满足额外的要求。此外,在进行软硬件选项评估的时候,其中一个必须考虑的元素就是在不断变化的业务环境中能否支持迭代的开发过程。能够根据需求变化而改变的分析系统,在长时间内都会体现它的价值。

  牢记用户需求,不是部分用户,而是所有用户。随着自助式BI工具的流行,在大数据分析项目中把终端用户放到考虑范畴之内就显得并不奇怪了。当然,能够应对不同数据类型的IT架构非常重要,但是系统的可操作性和交互性同样是我们需要考虑的问题。这需要我们把不同类型用户的反馈考虑在内,从高管层到操作工,从分析师到统计员都需要能够访问到大数据分析应用,不管是用何种方式。而他们对于工具的接受度,在很大程度上决定了项目成功与否。举例来说,普通员工或者业务经理不需要自己去运行一个大数据分析查询,他们只需要能够访问可视化的报表或者仪表盘就可以了。而分析人员以及IT部门可能就需要一些深入的功能。

  并没有一种方法能够确保所有的大数据分析项目成功,但是了解一些最佳实践一定能够让你的大数据项目规划变得更加清晰。对于大数据分析的技术问题太过细节复杂,不是一朝一夕能够解释清楚,因此我们在本文中并没有提到技术细节。但技术和业务两方面决定着大数据项目的成败,只注重技术而忽视业务需求将会导致项目失衡,反之亦然。


作者:孙瑞 译

来源: IT168

原文标题:企业部署大数据分析项目成功的秘诀


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
14天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
26天前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
1月前
|
数据采集 运维 数据挖掘
API电商接口大数据分析与数据挖掘 (商品详情店铺)
API接口、数据分析以及数据挖掘在商品详情和店铺相关的应用中,各自扮演着重要的角色。以下是关于它们各自的功能以及如何在商品详情和店铺分析中协同工作的简要说明。
|
2月前
|
API
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
104 0
|
6天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
21天前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。
|
28天前
|
存储 NoSQL 大数据
新型数据库技术在大数据分析中的应用与优势探究
随着大数据时代的到来,传统数据库技术已经无法满足海量数据处理的需求。本文将探讨新型数据库技术在大数据分析中的应用情况及其所带来的优势,为读者解析数据库领域的最新发展趋势。
|
1月前
|
分布式计算 NoSQL 大数据
探索数据宇宙:深入解析大数据分析与管理技术
探索数据宇宙:深入解析大数据分析与管理技术
55 1
|
2月前
|
分布式计算 并行计算 大数据
Python多进程在数据处理和大数据分析中的应用
Python多进程在数据处理和大数据分析中的应用