数据分析三大思路及方法
在上一篇博文【什么是数据分析】中,我们介绍了数据分析的基本概念、流程、方法。这篇文章我们来看看数据分析的基本思路以及常见的数据分析方法。在互联网分析中,基本遵循以下三个步骤:
- 找出问题
- 分析问题
- 解决问题
接下来,我们来看看如何进行一个完整的数据分析过程。
1.找出问题
第一步:找出问题,使用描述性统计
精确使用描述性统计可以对样本的基本情况 和特征进行说
阅读好时光的流量情况怎么样?
第二步:找出问题、着眼于变化,找出异常值
日常工作中的流量数据、用户数据、转化数据、交易数据都有固定的波动周期,每个周期内的数据变化应该是趋于稳定的,如果某天的数据不在符合预期的范围内稳定变化就是数据异常。 对数据异常的敏感度主要有:数据波动是否为异常?异常的范围、波 动的程度,是否需要深入分析。
评估变化的方法
同比:对比同期变化 (和上周比)
环比:对比连续周期
增长率:可以有效评估累计型的指标
2.分析问题
第三步:细分指标,多维度分析值
通过多维度、拆分指标进行分析,来寻求指标变化可能的原因。
- 同一指标,不同维度
- 拆解指标,深度思考
常用的指标维度:
用户指标:地区、年龄、性别、学历、设备型号、操作系统 (用户画像)
产品指标:产品类型
运营指标:活动类型
营销指标:营销渠道、营销方式
地区维度:海外、国内
产品维度:少儿图书
渠道维度:站内广告,广告合作
年龄维度:年龄分布
通过分析,我们发现海外地区的APP用户UV在逐渐下
交叉分析
只关注单一维度和指标会造成我们主 观判断上的偏差:
● 幸存者偏差
● 维度偏差:虽然UV下降,但是转化率可能提升。
要从多维度多指标来进行分析。
关联分析:
引入转化率作为交叉分析的指标,从折线图来看,转化率和UV的关系并不大
第四步:相关性分析,找出问题关键因素
相关性分析对两个或多个具备相关性的变量元素进行分析,从 而衡量两个变量因素相关的密切程度。 相关性分析在数学层面很难做到严谨性,但是在业务层面具有非常大的可解释性。
第五步:预测趋势,展望未来
在业务中,我们通常通过预测性分析来判断核心业务指标的发展趋势。 尽管预测性分析可以为未来的趋势提供指导,但是预测也 只是一种估计,数据的质量和业务状态的稳定性决定着预 测的准确性,所以这类分析往往需要持续不断的优化
3.解决问题
第六步:积极沟通,促进业务落地
我们基于数据,做出了上述分析。现在我们需要去把我们的 结论和分析的逻辑去和业务方落实,确保我们的分析无误且 结论能够被业务方所接受
如何将业务问题转化成数据问题?
- 指标:确定业务问题的关键指标,进行适度拆分
- 维度:确定业务问题的纬度,围绕纬度构建问题
为什么发生这个问题?
为什么要分析这个?
为什么这个重要?
常见分析方法
1.漏斗模型
漏斗模型是一套流程式数据分析模型,用来反映用户在流程里的关键行为以及从起点到终点各阶段转 化和流失情况
- 流程
- 关键行为
- 转换和流失
价值:
- 可以帮助分析师定位流程中的短板
- 利于多维度切分,捕捉用户行为变化,发现异常
- 有助于观察和比较不同用户群体之间的差异,持续提升用户体院
如何建立一个漏斗模型
- 梳理主要路径和流失节点
选的核心路径
- 选择开口大的路径:例如淘宝购买商品,搜索位,banner位置,十大金刚位,运营位
- 漏斗环节不能太多:太多的话不好聚焦问题
- 漏斗环节间的量差不能太大:
观察比较数据
- 纵向对比
- 横向对比
案例:电商网站使用漏斗模型提升转换率
因为收银台之后到完成订单直接就是支付了,因此这里才20%可能太低了。
搜索列表
- 搜索点击率 (搜索结果首页 点击率)
- 详情页转化率
- 搜索无结果次数
- 需要关注搜索的途径:搜索框 搜索、语音搜索、推荐搜索
订单页面和收银台页面
- 有效订单转化率
- UV成交转化率
- 平均UV价值
- 需要关注物流、退货、发票、运费、支付方 式、支付异常(密码错误、冲动消费、技术 问题...
详情页
- 平均页面停留时间
- 加入购物车数目
- 需要关注详情页面的排版设计、 评论、客服...
通过观察订单页转化率过去六个月的变化曲线,我们发现 六月份的订单页转化率下降了25%以上。 在六月份京东APP已经开始了“6.18”抢券赢折扣活动,订单页的转化率降低是不是和这个活动有关系?
横向比较:看用户,找不同,进一步验证假设
通过对参加活动的用户和未参加活动的用户进行对比分 析,我们发现参加活动的用户的订单页转化率比未参加活 动的用户低近40%,初步说明了订单页转化率和“6.18”活 动有很强的相关关系。 我们进一步了解活动细则,发现这个活动是在每天下午5 点和6点之间发放优惠券,选择这个时间的原因是大量的 用户会在这段时间通勤,我们在这个时间段有很多活跃用户。
根据活动的细则,我们进一步去对比工作日和周末的下午5点到6点的订单页转化率,结果显示工作日的订单页转化率几乎是周末的一半。考虑到这段时间我们有大量的活跃用户,且大量的活跃用户是在通勤的路上,那么我 们就可 以有两个方向去深挖:
- APP的稳定性
- 用户的网络状况经过和IT部门的沟通,活动期间APP的稳定性良好,那么 我们进一步来深挖用户的网络状况。
我们在用户的网络环境维度上对付款成功情况租了对比,发现在这一时段有约20%的用户是处于2G、3G甚至离线的环境说明用户的网络环境对付款成功率确实有很大的影响。 结合我们前面得到的结论,我们可以判断在工作日的活动时段参加活动的可能会因为通勤或者其他原因导致网络环境不稳定 ,从而降低了付款成功的可能性,导致订单页面的转化率降低。
跳出漏斗,关注用户体验
上面我们分析到了网络状况。
下面我们进一步跳出漏斗,关注用户体验
在支付界面,一直显示正在支付,我们并不知道支付成功还是失败(这个时候考虑优化界面,支付失败就直接显示,让用户能够重新支付。或者在特殊活动时期考虑延迟支付时间)
我们可以发现付款失败的用户停留的时间更久。
2.矩阵模型
波士顿矩阵(BCG Matrix) 又称市场增长率—相对市场份额矩阵、波士 顿咨询集团法、四象限分析法、产品系列结构管理法等。 波士顿矩阵 是由美国大型商业咨询公司——波士顿咨询集团首创的一种规划企 业产品组合的方法。 波士顿矩阵采用销售增长率和市场占有率两个指标来衡量产品。销 售增长率与市场占有率既相互影响,又互为条件。 通过以上两个因素相互作用,会出现四种不同性质的产品类型,形成 不同的产品发展前景:
- 销售增长率和市场占有率“双高”的产品群(明星类产品)
- 销售增长率和市场占有率“双低”的产品群(瘦狗类产品)
- 销售增长率高、市场占有率低的产品群(幼童类产品或者问题类产品)
- 销售增长率低、市场占有率高的产品群(金牛类产品)
明星产品: 高增长且高市场占有率,发展前景好,竞争力强,需加大投资以支持其发展;
金牛产品: 低增长但高市场占有率,成熟市场的领导者 ,应降低投资,维持市场占有率并延缓衰退
问题产品: 高增长但低市场占有率,发展前景好但市场开拓不足,需谨慎投资;
瘦狗类产品: 低增长且低市场占有率,利润率低甚至亏损 ,应采取撤退战略
波士顿矩阵模型四个原则:
- 月球原则:我们的产品锁定在问题产品、明星产品、金牛产品。
- 黑球原则:在有的时候,企业处于初步发展期,可能没有现金牛产品,因此需要快速发展
- 对角原则:如果在明星产品上,我们希望转换到金牛产品
- 跃迁原则:问题产品–>明星产品–>金牛产品
明星型用户: 消费次数和客单价均高于平均水平,值得我们重点关注,有针对性的增加运营活动,提高用户的忠诚度
金牛型用户: 客单价低于平均水平,但是消费频次高,能给企业带来稳 定的收益,一般不需要特别关注
问题型用户: 客单价高于平均水平,但是消费频次低。对于这类用户应当通过推送、邮件、优惠券等活动促进回访,提高消费频次
瘦狗型用户: 客单价和消费次数均低于平均水平,应当进一步了解用户的痛点,适当采取个性化推荐、搭售等活动提高用户的客单价和消费次数。
3.个性化推荐
基于关联规则的推荐 (user-item) 基于关联规则的推荐的前提是用户已经购买了某个商品, 然后根据用户已购买商品和其他商品之间的相关性做出推荐。关联规则的建立是采用概率统计的方式来判断某两种 或者多种商品之间的相关性有多大。
协同过滤推荐 协同过滤推荐是利用最近邻算法得到用户和用户,物品和 物品的相似程度而产生推荐结果。
● 用户和用户(user-user):只要找出相似用户喜欢的 物品,并预测目标用户对对应物品的评分,就可以找 到评分最高的若干个物品推荐给用户。
● 物品和物品(item-item):只要找到了目标用户对某 些物品的评分,那么我们就可以对相似度高的类似 物品进行预测,将评分最高的若干个相似物品推荐 给用户。