随着互联网、5G时代到来,大数据横空出世,数据变得越来越重要,如何针对业务问题和需求 ,提取有效特征数据并对问题进行深入分析,最终得到可靠的结论是数据分析最核心的环节,只有得出正确的结论才能对症下药,提出正确的方案,为产品运营提供有力支撑(点击文末“阅读原文”了解更多)。
然而恰恰是在深入分析并得出可靠结论这阶段最难实现,分析角度不能完全依赖主观猜想,而需要客观系统的逻辑思维,这将是最大的挑战;
以淘宝用户行为分析为例:
任务/目标
通过探索用户行为规律,为平台运营提供数据支撑,从而帮助淘宝商家实现营收增长。
数据准备
数据源于淘宝某商品买家行为数据集(查看文末了解数据免费获取方式),该数据集包含用户的所有行为(包括点击、购买、加购、收藏)。数据集的每一行表示一条用户行为,由用户id、商品id、商品类目id、行为类型和时间戳组成;
使用MySQL导入源数据,并抽取其中300万数据,接下来对数据缺失值、重复值和异常值处理,之后在对数据进行必要的变量变换,这里将时间数据拆分成了年、月、日和小时;
做完以上一系列处理,为后面的数据分析做准备:
用户行为分析:
1、首先采用AARRR模型分析用户使用产品的整个流程,即用户生命周期,包括从浏览到最终购买的用户转化、用户留存情况以及用户的复购率等指标,模型从获客、转化激活、留存和再变现四个方面分析了用户行为。
2、其次是用户行为路径分析,从整体到局部,根据转化率漏斗图,查看用户在整个购物过程中的转化情况,若转化率低,通过假设检验、对比分析,找到转化率低的原因并提出改善转化的建议;
3、最后,进行用户消费偏好分析,找出用户最喜欢的商品,并通过假设检验分析出畅销商品好卖的原因,为商品的运营及营销提供策略支持;
点击标题查阅往期内容
数据分享|R语言聚类、文本挖掘分析虚假电商评论数据:K-MEANS(K-均值)、层次聚类、词云可视化
经过分析后,最终发现如下结论:
1、每天都有一定的新增用户,但是却越来越少,不过在周末却有小幅回升,推测是由于营销活动吸引了新老用户。
2、由于促销活动,用户活跃度在周末会有小幅上涨,且在一天中有两个高峰期,分别是上午 10 点至下午 1 点以及晚上 8-10 点;
3、参考脸书次日、3日、7日留存的 40%-20%-10% 法则,淘宝 75% 以上的普通留存率说明用户对淘宝整体还是相当满意的,在购买留存方面,已进入稳定期的淘宝购买用户的留存率能达到 20% ,已经算是优秀了,但次日留存却不理想;
4、淘宝复购转率高达 66%,这个成绩相当可观,然而其中高复购数的用户非常少;
5、用户多数是在浏览商品页面,而很少购买,用户只对收藏的商品有购买意向,而由于其他原因导致购买转化低,此外,既收藏又加购的商品的购买转化率最高;
6、淘宝商品销售主要依靠长尾商品的累积效应,而非爆款商品的带动。淘宝推荐的商品没有赢得人们的青睐,购买转化率低下。
针对以上结论给出如下建议:
限于版面,这里给出重点几个建议:
1、淘宝需要进行进一步新增用户的人群定位并找出最佳的营销活动的推广渠道,以进一步增长用户;
2、集中在周末晚上 18-23 点多推出促销活动,如拼团、直播带货,推送用户喜欢的新品及畅销品、优惠券和促销活动消息等,提高购买率;
3、在周末或是节假日多做营销活动,提高用户使用淘宝的频率;高留存率下,重点应转向如何提升营收与病毒传播(黑客增长)上;
4、将经营重点放在培养用户忠诚度上,鼓励用户更高频次的消费,从商品和服务质量、物流体验等方面找原因,争取突破高复购率;
5、在商品详情页精简的呈现用户重点关注的信息,增添同类商品比较的功能,缩短用户寻找信息和返回搜索结果来回对比的时间成本;将加入购物车和收藏的按键放在用户滑屏时也能方便触达的地方;
6、既收藏又加购的商品的购买转化率高于其他路径转化率,商家可以通过适当的营销方式引导用户增加收藏与加购,如提前收藏加购专享价,收藏加购有礼,提前发货,送运险费等;
7、通过明星 / 网红推荐,结合节假日主题活动,提高畅销品的曝光率,打造爆款的产品,并利用爆款品带动整体商品的销售,比如将畅销品和非畅销品捆绑展示或关联推荐,提升商品购买转化率;