关于啤酒和尿布故事的真相

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:

“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。这种关系令人费解,这是一个真正的规律吗?经过跟踪调查, 研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了 捆绑销售,不出意料,销售量双双增加。”

——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》

第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市卖酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。

原来这个故事在欧美国家也被传唱,出现的版本还不尽相同。但对此质疑的声音也不少,其中有一位叫Daniel J. Power的教授特此撰文,应该是最全面地有理有据揭开这个故事后面的真相。有兴趣的同学可以详细阅读英文全文:What is the "true story" about using data mining to identify a relation between sales of beer and diapers?。主旨内容如下:

  • 这家连锁店不是沃尔玛,而是Osco Drugs,一家主要在美国中西部经营的药房和便利店。
  • 该公司于1992年就着手进行数据挖掘项目,算是数据挖掘的先驱者。
  • 当时的项目收集了来自25家分店、一千两百多万个购物车的信息。
  • 数据的确发现:下午5点到7点之间,客户购买了啤酒和尿片。
  • 商店管理层的确对此发现表示兴趣。但现实中,并没有重新设计商品的摆放,没有把啤酒和尿布进行捆绑销售。不过,公司保守地对销售流程进行了改造,即在正确的时间放正确数量的正确商品。

这就是啤酒和尿片的故事真相,所以,这其实并不是数据挖掘的好故事。大家对此故事津津乐道,无外乎希望表达:数据挖掘技术是商业决策的好帮手!


本文作者:Shirley Xie

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
计算机视觉 Python Windows
今天这几张照片在我的朋友圈里炸锅啦!背后的真相令人...
今天这几张照片在我的朋友圈里炸锅啦!背后的真相令人...
43 0
|
程序员 决策智能
博弈论(一)——产品小哥哥的民主妙计
博弈论(一)——产品小哥哥的民主妙计
91 0
|
存储 人工智能 自然语言处理
ChatGPT 大智近妖,从宇宙人生到手搓光刻机,从哄女朋友到写年终总结我们聊得非常开心,反而让人越来越忧心
都说 ChatGPT 要干掉程序员,清理搜索引擎,取代 Stack Overflow,还能消灭人类,这些有些言过其实了。ChatGPT 的定位是一个人工智能助理,它说,它的主要目的是通过回答用户的问题,为用户提供帮助。在体验了一天后,我相信对它的调教是成为一个正直的人,它也是这样做的。 它谦虚有礼,无疑是一个合格的助理,确实可以为我们提供很大的帮助。生成的回答条理清晰,思路明确,令人信服。但是从刚接触的惊奇开心过后,随着时间推移,我却越来越忧心了。 以下的内容是我的体验过程和其中的思考,其中引用的部分为 ChatGPT 的回答内容。希望对你了解它有一些帮助。
349 1
ChatGPT 大智近妖,从宇宙人生到手搓光刻机,从哄女朋友到写年终总结我们聊得非常开心,反而让人越来越忧心
|
算法 关系型数据库 定位技术
为什么订餐不会凉凉和牛顿发现万有引力有关
希望通过本次课题,与大家探讨订餐系统的技术难点及提出解决方案。
为什么订餐不会凉凉和牛顿发现万有引力有关
|
Arthas 运维 安全
|
程序员
第二夜:万圣节,讲一个关于程序员的故事
次日中午,小王已经不知睡去了多久,渐渐恢复了知觉。感觉嘴鼻被一团毛绒的东西压着,似乎还带着女人特有的体香。小王潜意识中出现了一个邪恶的画面感,顿时清醒了。睁开眼睛发现自己竟然躺在茶水间的沙发上,身上盖着一件女式的厚毛领风衣,昨天晚上发生的事情他似乎已经断片,他正努力的回忆自己是何时睡在了这里时。
1105 0
|
程序员 安全
第一夜:万圣节,讲一个关于程序员的故事
  小王加入这家公司刚刚一个星期,这天临时有一个需求,他和同事们加班到了很晚,因为家离得很远而这个时间早已没有公交车了,他索性决定不回家了通宵把BUG 都解决 。同事们陆陆续续都离开了,最后一个走的同事劝他还是不要在公司过夜,如果实在没有地方去,可以到网吧包宿。
1023 0
|
大数据
不想去健身房的我,最后被贝叶斯分析说服了...
可能经常你会听到一些很主观的评价比如“你太瘦了”或者“你怎么那么高”,但这里瘦或者高都是基于评价者的主观判断和视觉记忆做出的评述,并没有严格的参照。
1212 0
|
搜索推荐 前端开发 Java
【程序媛晒83行代码】素颜女神,轻松分析用户画像
坤0830小姐姐的第83行代码来自一段爬取指定用户评论区的粉丝信息然后分析并画出用户画像的项目,很好玩。
2459 0
下一篇
无影云桌面