大数据让商业智能和预测分析如虎添翼

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

本文讲的是大数据让商业智能和预测分析如虎添翼,我们都知道,预测分析一直是“象牙塔里”统计学家和数据科学家的“特权”,他们远离日常业务决策者。大数据将改变这种状况。

  随着越来越多的数据流被放到网上,并整合到现有的BI、CRM、ERP和其他关键业务系统,预测分析最终将成为关注的焦点。虽然大多数客户服务代表和现场销售代表还没有感受到这种影响,IBM和MicroStrategy等公司已经开始行动。

  大数据:预测分析不再是统计学家的特权

  想象一下这样的世界,客户服务代表可以独立决定一个问题客户是否值得保留或者升级,又或者,销售人员可以基于人们对零售商在Facebook或Twitter上的评价来调整零售商的产品量。

  大数据将组群分析和回归分析等较常用的工具交到日常管理人员手中,然后他们可以使用非交易数据来做出战略性的长期的业务决定。

  然后,大数据并不是要取代传统BI工具,Gartner研究公司的BI分析师Rita Sallam表示,大数据将让BI更有价值和更有利于业务发展,“我们总是会需要看看过去的数据,当你拥有大数据时,你更应该这样做。BI并不会消失,它通过大数据被加强了。”

  你如何知道在发现初始阶段看到的预测会随着时间的推移而得到证明呢,例如,在中西部地区,红色钱包真的卖得比蓝色钱包好吗?初步数据分析可能会这样建议,因为上一季度(甚至更早期)红色钱包卖得更多,所以红色钱包卖得更好。

  但是这具有相关性,并不存在因果关系。如果你更加仔细地查看---使用从BI工具收集到的历史交易数据,你会发现,实际上是因为最新商家定位活动造成了这样的结果,因为商家将目光都放在红色钱包上。

  这也是为什么IBM公司的新兴技术主管David Barnes更倾向于参考来自大数据技术(例如Hadoop、map/reduce等)的结果。例如,你不会想基于对Twitter流的情感分析来作出关键业务决策。

  分析社交媒体中的非结构数据能够获得直接回报

  社交媒体存在很大的商机。例如,作为零售商,你发现Justin Bieber的分析非常喜欢他在昨晚演唱会穿的外套,并且有人在Twitter上表示他从你的商店买到了一件,然后你可以快速决定增加那件外套的存货量,因为你知道这件衣服将非常热门,但只是在非常有限的时间内。

  如果没有预测分析(PA),你很可能错过这个机会。

  “在过去,我们会根据历史数据来做决定,但现在时代不同了,”Barnes表示,“现在我们需要预测分析。”

  我们需要结合开源技术(大多数大数据平台都源自开源)、摩尔定律、商品硬件、云计算以及捕捉和存储大量非交易数据的能力来实现预测目的。

  通常被认为是大数据背后的驱动力的非结构化数据(例如视频和电子邮件)几乎没有参与这一过程。你可以刷博客和用户论坛,然后将这些信息与地理数据相关联,并结合现有结构化客户数据,和来自Micro Strategy Wisdom引擎(追踪1400万Facebook用户对你的品牌的评价)等新来源的信息,这样你就获得了强大的预测能力。

  BI供应商MicroStrategy公司的行业营销主管P.K.Paleru表示,大数据已经发生了两件事情,“你可能给结合不同来源的各种类型的数据,你还可以对所有这些数据进行微优化。”

  缩短大数据分析时间

  信息管理和分析咨询公司New Vantage Partners公司的创始人兼管理合伙人Paul Barth表示,这种分析的一个很大优势在于缩短“回答时间”(TTA),数据科学家曾经需要花几个月时间来建立查询或者模型以回答关于供应链或生产计划的前瞻性业务问题,现在只需要几个小时就可以完成。

  这是因为大数据技术允许信息在被优化或者关系化之前进行分析。再加上高级分析技术,让业务经理在非常短的时间内询问和回答问题,不过,现在仍然需要IT员工和数据建模人员伸出援助之手。

  “这些人正在使用大数据来自动化机器学习等过程,”Barth表示,这样做可以为每个产品线、每个市场产生20000个数据模型,让用户可以预测未来18个月。“这是一个很大的变化,他们之所以能这样做是因为大数据技术可以自动化很多建模步骤,并可以在无人职守的情况下执行。”

  在不久前,这几乎是不可能的,统计分析师需要数周甚至数月来建立单个模型。如果你销售100个产品,你的整个产品线不可能超过1000个模型,这意味着这些模型返回的信息并不是很准确。

  大数据分析的黄金时期还未到来

  虽然这一切让业务用户感到激动,但是大范围普及大数据分析技术并不会那么快发生。Hadoop虽然很强大,仍然只是用于处理海量数据集的“原始”工具。

  仔细考虑一下这些预测分析结果的实用性,1亿个人的意见真正超过10万人的意见吗?

  “存在大量的重复的数据,”Barth表示,如果你想要正确地进行分析,“你仍然需要聪明的分析师”,幸运的是,大数据为他们提供了非常强大的工具。

作者: 邹铮

来源: IT168

原文标题:大数据让商业智能和预测分析如虎添翼

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
2月前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
3月前
|
数据可视化 搜索推荐 大数据
基于python大数据的北京旅游可视化及分析系统
本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。
|
4月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
381 4
|
4月前
|
JSON 大数据 API
巧用苏宁易购 API,精准分析苏宁易购家电销售大数据
在数据驱动的电商时代,精准分析销售数据能助力企业优化库存、提升营销效果。本文详解如何利用苏宁易购API获取家电销售数据,结合Python进行数据清洗与统计分析,实现销量预测与洞察提取,帮助企业降本增效。
107 0
|
5月前
|
消息中间件 NoSQL 数据可视化
数据说了算,可你得“听得快”——聊聊大数据里的实时分析
数据说了算,可你得“听得快”——聊聊大数据里的实时分析
135 2
|
3月前
|
存储 SQL 分布式计算
终于!大数据分析不用再“又要快又要省钱”二选一了!Dataphin新功能太香了!
Dataphin推出查询加速新功能,支持用StarRocks等引擎直连MaxCompute或Hadoop查原始数据,无需同步、秒级响应。数据只存一份,省成本、提效率,权限统一管理,打破“又要快又要省”的不可能三角,助力企业实现分析自由。
222 49
|
2月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
2月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
2月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。