大数据分析项目中的“最差”实践

简介:
本文讲的是 大数据分析项目中的“最差”实践, 大数据分析现在很火。只要你浏览任何IT出版物或者网站,你都能看到商务智能供应商和他们的系统集成合作伙伴推销帮助企业实施和管理大数据分析系统的产品和服务。这些广告和大数据分析的新闻以及供应商匆匆提供的案例研究可能会使你误认为大数据是很容易的事,误认为要成功部署只需要一种特别的技术。

  如果它是那么简单就好了。当BI供应商乐呵呵地告诉你他们的客户已经成功部署大数据分析项目时,他们不会告诉你还有那么多失败的案例。大数据分析项目令人失望是有一些潜在原因的。你可以找到大量关于大数据分析最佳实践的建议。但下面是一些大数据分析项目的最差实践,你需要了解如何避免它们。

  “盲目跟风。”这种观点重复犯了经典的错误,组织开发他们的第一套数据仓库或者BI系统时经常会犯这样的错误。太多时候,IT和BI以及分析项目管理者被技术炒作所迷惑,忘记了他们首要任务的商业价值;数据分析技术仅仅是一个用来产生商业价值的工具。大数据分析的支持者们不应该盲目地采用产品,他们首先需要判断该技术所服务的业务目标,以便建立业务案例,——然后为手头工作选择正确的分析工具。没有对业务需求的深刻理解,会存在很大风险,项目团队最终可能将创建出一个“大数据磁盘场”,而不是真正对组织有价值的东西,得到的是一个不想要的“数据狗窝”。

  “误认为软件可以回答所有问题。”构建一个分析系统,尤其是涉及大数据的分析系统是非常复杂的,也是资源密集的。因此,许多组织希望他们部署的软件将成为银弹,神奇地实现一切。当然,人们应该明白希望总是比现实更美好。软件确实会带来帮助,有时帮助还会很大。但是大数据分析的效果取决于被分析的数据和使用工具的分析技能。

  “思路太过僵硬。”通常,人们总是不断尝试他们过去的做法,即便当他们面对不同的场景时也会这样。在大数据情况下,一些组织会想当然地认为所谓“大”只是意味着更多的交易和更大的数据量。这种观点可能是正确的,但是许多大数据分析策略会涉及非结构化和半结构化信息,需要以完全不同于企业应用程序和数据仓库中结构化数据的方式管理和分析。因此,我们需要一套新的方法和工具来进行大数据捕获、清洗、存储、集成和访问。

  “忘记过去所有的教训。”有时企业会走向另一个极端,认为大数据中的一切都是完全不同的,他们必须从头开始。对于大数据分析项目的成功,这种错误可能甚至比认为没有不同更要命。只是因为你希望分析的数据结构不同,并不意味着我们已有的数据管理基本原则需要重写。

  “没有必备的业务和分析专业知识。”误认为该技术可以实现一切的必然结果就是,相信所有你需要的只是让IT员工实施大数据分析软件。首先,与上述产生商业价值主题相符合,有效的大数据分析项目必须在系统设计阶段以及持续运营过程中结合广泛的业务和行业知识。其次,许多组织低估了他们需要分析技能的程度。如果大数据分析仅仅是构建报表和仪表盘,企业可能可以利用他们现有的BI专业技能。然而,大数据分析通常涉及更高级的过程,比如数据挖掘和预测分析。这需要具备统计、决算以及其它高级技能的分析专业人士,这可能意味着组织需要新聘请人员来迈出向高级分析进军的第一步。

  “把项目当作科学实验。”太多时候,公司衡量大数据分析项目的成功仅仅是通过数据收集和分析来进行。而事实上,收集和分析数据只是开始。如果结合了业务流程,并促使业务经理们和用户们为改善组织绩效和业绩而付诸行动之后,分析才能产生商业价值。要获得真正的效率,就需要把分析项目纳入反馈闭环,以便交流分析结果,然后基于经营业绩提炼分析模型。

  “承诺太多,想做的太多。”许多大数据分析项目陷入了一个大误区:支持者过度宣扬他们部署的系统会有多么快,业务会获得多么重大的益处。过度的承诺和交付的不足必然导致业务与技术的分离,这样组织一般会很长时间都推迟特定技术的选用——即便其它许多公司已经使用该技术获得了成功。此外,当你设定了很轻松很快就能获益的预期,业务主管就有一种认识倾向,容易低估了需要参与和承担义务的程度。当足够资源不能兑现的话,预期的收益通常不会来的容易或者迅速,那么项目基本就贴上了失败的标签

  大数据分析可以给组织带来很大的商业价值,但是如果你不小心,不从其它公司犯的错误中吸取教训的话,它也可以带来灾难。谨记上述的几点问题,切莫成为大数据分析项目的反面典型。


作者:冯昀晖 译

来源: IT168

原文标题:大数据分析项目中的“最差”实践


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 大数据 API
大数据隐私保护策略:加密、脱敏与访问控制实践
【4月更文挑战第9天】本文探讨了大数据隐私保护的三大策略:数据加密、数据脱敏和访问控制。数据加密通过加密技术保护静态和传输中的数据,密钥管理确保密钥安全;数据脱敏通过替换、遮蔽和泛化方法降低敏感信息的敏感度;访问控制则通过用户身份验证和权限设置限制数据访问。示例代码展示了数据库、文件系统和API访问控制的实施方式,强调了在实际应用中需结合业务场景和平台特性定制部署。
62 0
|
1月前
|
SQL 分布式计算 数据可视化
Tableau与大数据:可视化工具在大数据分析中的应用
【4月更文挑战第8天】Tableau是一款领先的数据可视化工具,擅长于大数据分析,提供广泛的数据连接器,支持多源整合。它与Hadoop、Spark等深度集成,实现高效大数据处理。Tableau的拖拽式界面和交互式分析功能使得非技术人员也能轻松探索数据。在实战中,Tableau用于业务监控、数据storytelling和自助式分析,推动数据民主化,提升决策效率。未来,Tableau将持续创新,扩展生态系统,并保障数据安全与合规性,助力企业最大化数据价值。
40 0
|
14天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
2天前
|
数据采集 供应链 安全
利用大数据优化业务流程:策略与实践
【5月更文挑战第11天】本文探讨了利用大数据优化业务流程的策略与实践,包括明确业务目标、构建大数据平台、数据采集整合、分析挖掘及流程优化。通过实例展示了电商和制造企业如何利用大数据改进库存管理和生产流程,提高效率与客户满意度。随着大数据技术进步,其在业务流程优化中的应用将更加广泛和深入,企业需积极采纳以适应市场和客户需求。
|
4天前
|
数据可视化 大数据 Python
python大数据分析处理
python大数据分析处理
10 0
|
5天前
|
机器学习/深度学习 人工智能 大数据
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
|
11天前
|
存储 机器学习/深度学习 数据采集
大数据处理与分析实战:技术深度剖析与案例分享
【5月更文挑战第2天】本文探讨了大数据处理与分析的关键环节,包括数据采集、预处理、存储、分析和可视化,并介绍了Hadoop、Spark和机器学习等核心技术。通过电商推荐系统和智慧城市交通管理的实战案例,展示了大数据在提高用户体验和解决实际问题上的效能。随着技术进步,大数据处理与分析将在更多领域发挥作用,推动社会进步。
|
14天前
|
存储 运维 监控
|
14天前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之要查看MaxCompute Studio中的项目中的计算任务代码,我该怎么操作
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
14天前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之该怎么创建MaxCompute的项目
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

热门文章

最新文章