数据分析系列剧第一集:问题诊断

简介: 小蔡大学毕业后,应聘到了一家名为“新新服装公司”的电商企业做分析师。上班第一天,数据部门主管周总就从系统后台导出一个excel数据表说:“小蔡,你看看用这些数据能分析哪些内容,我们需要搭建一套分析体系,你先考虑,下班前我们讨论一下。

小蔡大学毕业后,应聘到了一家名为“新新服装公司”的电商企业做分析师。

上班第一天,数据部门主管周总就从系统后台导出一个excel数据表说:“小蔡,你看看用这些数据能分析哪些内容,我们需要搭建一套分析体系,你先考虑,下班前我们讨论一下。”

面对密密麻麻一堆数字,小蔡不知道该从何处下手。于是,他向部门资深员工老李请教。

老李走到小蔡电脑前,看到表中共有7列数,字段名如下:

日期

城市

访问人数

放入购物车的人数

提交订单的人数

成交人数

销售额

老李说:“分析之前,你首先要搞清楚领导要解决什么问题。不同的问题有不同的方法……

“可是——”小蔡打断老李:“周总没说他要解决什么问题,而是给我这堆数,让我自己去想,说要搭建一套分析体系。”

老李笑着说:“搭建分析体系也要从领导要解决的问题出发,若领导未提具体需求,就要对领导可能的需求做假设。一般来说,领导都希望提升业绩,而要提升业绩,往往需要做问题诊断、市场预测、员工考核、优化资源配置等工作,所以你可以把这些内容列出来,再列出要完成这些工作常用的方法和所需的数据支持。比如,问题诊断可以用分类分析和销售漏斗分析等方法;市场预测有回归分析、时间序列等方法;员工考核可以用对比分析、定标比超等方法;优化资源配置可以制定物料计划、进行规划求解等等。(见图1)”

 

数据分析系列剧第一集:问题诊断

 

        图1 搭建分析体系

小蔡歪着脑袋继续问:“可是现在这堆数据能分析图1中的这些内容吗?”

老李指着表中的数据说:“小蔡,你看!

这数据里的4类人数对应的是一个购买流程,因此可以通过各流程的转化率做问题诊断;

这数据里的日期和售额可以构成时间序列,因此可以做市场预测;

这数据里的城市和销售额可以构成各城市的业绩完成水平,

如果结合各城市的年度计划,就可以做各城市销售总监的考核;

如果结合资源投入,就可以优化资源配置。”

小蔡听后顶礼膜拜:“老李,您太厉害了,跟您一聊,思路开阔多了。那我就先做问题诊断吧。可这么多数我该如何做呢?”

老李:“做问题诊断就像剥洋葱,一层一层地剥,才能看到本质。你先要想一想,你要对谁做诊断?”

小蔡想了想说:“我想对城市做诊断,看看公司在哪些城市的客户转化率存在问题。”

老李伸出拇指说:“角度不错!要诊断城市,就要把不同城市的数据按月份或年份做汇总,你来做一下。”

小蔡数据透视表用的很熟,很快做出了新新服装公司2012年在各城市的客户规模与销售业绩(见表1)。

1  2012年新新服装在各城市的客户规模与销售业绩

城市

访问人数

放入购物车的人数

提交订单人数

成交人数

年销售额

广州

3425

1158

992

548

10448306

成都

3289

875

597

296

4657819

北京

3425

1584

1200

612

9568848

上海

3249

907

723

496

8573326

武汉

2944

1124

847

265

3156295

郑州

686

215

126

48

736219

济南

657

382

307

92

1403749

天津

3200

1520

541

320

5114672

南京

813

314

140

65

1523625


老李问:“既然你想对城市做问题诊断,就需要找出哪些城市业绩不理想,怎么找?”

小蔡想了想说:“我可以做分类分析,用成交人数和年销售额把城市分成几类。其中,成交人数反映了业绩的数量;年销售额反映了业绩的质量。”说着,小蔡用表1的数据,画出了各类城市的业绩对比图(见图2

 

数据分析系列剧第一集:问题诊断

 

2 各城市的业绩对比

老李继续问:“从这张图中,你能得到什么结论?”

小蔡回答说:“可以看出,按照业绩表现,城市可以分为三个梯队。

第一梯队(北京、广州、上海)成交数在400人以上,年销售额超过800万。

第二梯队(天津、成都、武汉)成交数在200-400人之间,年销售额在300-600万之间

第三梯队(济南、南京、郑州)成交数小于100人,年销售额小于200万”

老李接着问:“那城市之间的这种梯队差异是由哪些因素造成的呢?”

小蔡想了想说:“访问人数及其转化率。访问人数低或其转化率低,都会影响城市最终的业绩表现。”说着,小蔡画出了各城市在访问人数及其转化率的表现。(见图3

 

数据分析系列剧第一集:问题诊断

 

3 各城市的访问人数及其转化率对比

老李继续追问:“根据图3,你能写出这些城市的类别、特点和相应的营销策略吗?”

小蔡想了想,写出了表2

2 各类城市的特点及相应的营销策略

 

数据分析系列剧第一集:问题诊断

老李点点头说:“写得不错!从表2可以看到,成都、武汉、天津这三个城市就是你做问题诊断的对象——一方面,这三个城市客户转化率低,存在一些问题;另一方面,这三个城市市场规模大,有值得改进的空间。”

小蔡皱起眉头问:“那如何对这三个城市进行问题诊断呢?”

老李在纸上边画(见图4)边说:“可以用销售漏斗法,分析从用户访问到在线支付各阶段的转化率,从而找到转换率低的问题环节,提出相应的提升路径。” 

 

数据分析系列剧第一集:问题诊断

4 销售漏斗法

小蔡仔细研读并领悟了图4,于是用表1的数据,计算出成都、武汉、天津以及标杆城市的上一步转化率(见表3),并制作出相应的图表(见图5) 

3 问题城市与标杆城市上一步转化率的对比表

 

访问-放入购物车

放入购物车-提交订单

提交订单-在线支付

成都

22%

77%

52%

武汉

38%

75%

31%

天津

48%

36%

59%

标杆转化率
(北上广
平均转化率)

36.0%

80.4%

58.3%

     

    老李指着图5问:“小蔡,现在你能做出问题诊断了吗?”

 

           数据分析系列剧第一集:问题诊断

 

 问题城市与标杆城市上一步转化率的对比表

小蔡边看图边分析:“成都的问题主要出在用户访问到放入购物车的环节,对于成都的顾客应提升商品与网站的体验;天津的问题主要出在放入购物车到提交订单的环节,对于天津的顾客应加强促销、供应链建设和客户服务;武汉的问题主要出在提交订单到在线支付的环节,对于武汉的顾客应加强在线支付的用户体验;”

老李笑着说:“小蔡,做得很不错,可以去交差了!”

于是,小蔡拿着前面分析的成果,向周总汇报。

周总听完,喜出望外:“小蔡,不错嘛,干的漂亮!就按你的这个思路来,你已经完成了问题诊断,中秋之后你再研究一下市场预测、员工考核和资源配置的问题。”

“没问题!”小蔡出师大捷,心理美滋滋的。

从周总办公室出来,小蔡径直走到老李面前央求道:“小弟愚笨,今天多亏您悉心指点,才帮我度过难关。老李,请收我做徒弟吧!”

老李拍拍小蔡的肩膀说:“你谦虚了,你很聪明,很多问题一点就通,所差的就是项目的历练。好!我就收下你这个徒弟,关于后续的研究内容,有不会的,尽管来问。”


转载自《小宇军的新浪博客》

目录
相关文章
|
4月前
|
机器学习/深度学习 传感器 人工智能
AI与未来医疗:重塑健康管理新格局随着人工智能(AI)技术的飞速发展,医疗行业正迎来一场前所未有的变革。AI不仅在数据分析、诊断支持方面展现出巨大潜力,还在个性化治疗、远程医疗等多个领域实现了突破性进展。本文将探讨AI技术在医疗领域的具体应用及其对未来健康管理的影响。
人工智能(AI)正在彻底改变医疗行业的面貌。通过深度学习算法和大数据分析,AI能够迅速分析海量的医疗数据,提供精准的诊断和治疗建议。此外,AI在远程医疗、药物研发以及患者管理等方面也展现出了巨大的潜力。本文将详细探讨这些技术的应用实例,并展望其对健康管理的深远影响。
|
机器学习/深度学习 供应链 算法
【数据分析模型】描述性 vs 预测性 vs 规范性 vs 诊断分析
【数据分析模型】描述性 vs 预测性 vs 规范性 vs 诊断分析
|
数据挖掘
数据分析系列剧第二集:七步法的应用
    中秋佳节,小蔡带上月饼和葡萄到师傅老李家串门。 寒暄之后,大家开始闲聊。 老李:“小蔡,有没有女朋友呢?” 小蔡:“还没有呢,我想先有些积蓄,再交女朋友。
1332 0
|
新零售 数据挖掘
数据分析系列剧第三集:行业研究
  中秋过后,小蔡拿着他的计划和周总讨论。 小蔡:“周总,这是我放假期间制定的一份工作计划(见下图),您看是否需要调整?” 周总接过计划,看了一会说:“嗯,还不错!接下来你是要做预测,那说说你的思路吧。
1023 0
|
数据挖掘
数据分析系列剧第四集:行业研究报告与生产计划
在老李的指导下,小蔡画出了服装行业研究报告的思路框架(见下图) 接着小蔡基于该思路撰写了一份简要的报告(见下图)。   周总看完了这份报告,点点头说:“小蔡,写的不错!你对服装行业已经有了一定了解,接下来我们讨论一下你报告中提到的资源配置的问题。
1028 0
|
5月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
97 2
|
2月前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
108 4
数据分析的 10 个最佳 Python 库
|
5月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
271 4
|
5月前
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
106 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
|
2月前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。