【业务数据分析】—— 用户留存分析(以挖掘Aha时刻为例)

简介: 【业务数据分析】—— 用户留存分析(以挖掘Aha时刻为例)

一、用户留存是什么


在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户。这部分用户占当时新增用户的比例,即用户留存率,会按照每个单位时间(例如日、周、月)来进行统计。顾名思义,留存指的是“有多少用户留下来了”。留存用户和留存率体现了应用的质量和保留用户的能力。


● 新增用户留存率=新增用户中登录用户数/新增用户数×100%(一般统计周期为天)。


● 新增用户数:在某个时间段(一般为第一整天)新登录应用的用户数。


● 登录用户数:登录应用后至当前时间,至少登录过一次的用户数。


● 第N日留存率:指的是新增用户日之后的第N日依然登录的用户占新增用户的比例。


第1日留存率(即“次留”):(当天新增的用户中,新增日之后的第1天还登录的用户数)/第1天新增总用户数。


第3日留存率:(当天新增的用户中,新增日之后的第3天还登录的用户数)/第1天新增总用户数。


第7日留存率:(当天新增的用户中,新增日之后的第7天还登录的用户数)/第1天新增总用户数。


第30日留存率:(当天新增的用户中,新增日之后的第30天还登录的用户数)/第1天新增总用户数。


二、为什么要考虑用户留存


1、为什么要考虑用户留存?

当一个新的APP上线时,我们最关心的指标就是活跃用户数及新增的用户数。我们通过不断加大广告投放,不断开源,提高APP的曝光,从而带来更多新用户。开始时,获取新用户比较容易,新用户增长快速,但慢慢地就会到达瓶颈期,用户增长速度放慢。所以,如果没有关注用户的留存情况,就会导致我们获取的新用户不断流失,一边不断地获取新用户,一边用户不断地流失。


5cc9feef98f84f5e9be0c7c743ccd0f8.png


留存是转化漏斗里承上启下的关键,一边连着拉新和激活,把用户沉下来,另一边牵着转化和口碑,让真正沉下来的用户,更好地转化和传播。所以,留存才是一种持续增长的心态,只有留存做好了,漏斗才不会变“漏洞”。下面我们用5组数据来说明为什么应该把留存看得更重要。


数据1:10%的用户在下载APP的一周后仍继续使用,一个月后,这个数字只有2.3%。用户的长期留存很重要,有一些短期留存的用户长期来看都流失了,除了看短期活跃度,还希望用户可以持续活跃在APP中,所以做好长期的留存分析是至关重要的。


数据2:52%的APP会在3个月后失去至少一半的重度用户。即使有了稳定的用户基础,也需要恰当的策略来留住他们。大多数应用的重度用户如果没有经营好,也会流失,而且这部分用户流失的代价远比流失新用户大。


数据3:获取新用户的成本比留存现有用户的成本高5倍以上。互联网的获客成本越来越高,获客难度也越来越大。


数据4:老用户比新用户尝试新功能的可能性高50%。老用户会更愿意尝试APP新出的功能,他们的行为表现可以让我们更好地发现问题,而新用户通常可能因为本身的质量原因,让我们不知道是功能问题还是用户本身的问题而造成的指标波动。


数据5:Gartner公司预测,你公司未来80%的收入将来自20%的现有用户。企业的大部分收入都来自现有用户,而新增的用户贡献的收入占比较少,因为每一个新增用户都需要经过一个漫长的阶段培养成忠实用户,然后他们才会产生付费的行为,而现有的用户已经使用APP一段时间了,具有一定的黏性和忠诚度,付费的概率更大。


2、影响用户留存的可能因素

1.获客渠道不精准,用户质量较差


2.产品使用路径指引不明,用户体验不佳


3.产品功能与用户需求预期不符合


4.产品触发不足,用户使用习惯培养不到位


5.产品吸引力不足,缺乏用户激励


6.难以实现精细化运营,用户分群欠缺


3、用户留存的3个阶段

(1)、用户留存初始阶段(Initial Retention)


a8e797ba8747436a9b2fe27f9e1b6349.png


用户留存的初始阶段是最关键的。如何在初始阶段吸引用户对整体留存的影响远远超过其他任何因素——如果你在初始阶段失败,那么在接下来的阶段将几乎无法弥补。初始阶段是用户对你的产品和品牌的第一印象。理想情况下,你希望新用户参与核心功能,并尽快了解产品的实用性。


(2)、用户留存中期阶段(Mid-Term Retention)


c43bd5d96f37425fb0ff104c23a4cd69.png


中期阶段是使用户形成新习惯。无论用户在第一次使用产品时,即初期有多么兴奋,新奇感多么强烈,在时间久了之后,这种新奇感都会消失。很多产品经理认为初始阶段成功的Aha时刻能够让老用户继续留存下去,但不幸的是,单一的良好体验并没有创造出新的习惯。所以,你需要用不同的营销策略来提高用户黏性,比如,签到功能、定期的活动等,让用户不断参与。另外,你还需要去创造更多的Aha时刻。


(3)、用户留存长期阶段


前两个留存阶段主要集中在产品引导、用户体验和行为心理学,而这个阶段的目标是最终建立一个优秀的产品,并不断改进它。


前两个留存阶段主要集中在产品引导、用户体验和行为心理学,而这个阶段的目标是最终建立一个优秀的产品,并不断改进它。举个例子来说,修图/短视频行业逐渐热门,出现了一度很大的足记、美图、秒拍等APP,但是在这个行业,没有创新,就意味着走下坡,随着快手和抖音等APP的兴起,短视频行业的格局被重新改写。所以,如何将新思维、新创新运用到产品上,是产品保持长久竞争力的关键。


三、怎么进行用户留存分析(挖掘Aha时刻)


8a25d9a746fe312cc3552500cc2e7d33.jpeg

1、Aha时刻

Aha时刻(Aha moment)也被称为惊喜时刻,是用户第一次认识到产品价值时,脱口而出:“啊哈,原来这个产品可以帮我做这个呀!”简单来说,就是用户第一次使用产品时的惊喜体验。


Aha时刻主要发生在用户激活阶段,它是用户激活的关键。当用户被吸引来后,并不是所有的用户都会转化成活跃用户,如果用户获得Aha时刻,即从产品中发现了价值,就会顺利转化成活跃用户,而且较容易转化成黏性较高的忠诚用户。


2、Aha时刻的作用

单个用户在产品中生命周期包含4个阶段,拉新→激活→留存→流失。由于拉新(获取新用户)的成本越来越大,所以我们希望每获取一个用户,都能够尽可能地留下来,所以“拉承一体化”的打法非常重要。


不只是把用户从渠道利用采买的方法吸引过来,同时要做好用户进入APP后的承接。那怎么做承接呢?需要针对用户进行相对应的Aha时刻的分析,发现留存的Aha时刻。


当我们找到用户的Aha时刻后,就可以有针对性地引导用户去找到他们的Aha时刻,从而提高用户留存率。比如,短视频类APP,通过数据分析发现,7天内用滤镜拍了3个视频的用户的留存率会大大提高,那么产品经理就可以引导用户多用滤镜拍视频,同时也可以对滤镜的功能进行相应的优化。


3、挖掘Aha时刻

挖掘Aha时刻的方法论本质是通过分析找到使用户留存率最高的那个行为。将其运用到产品设计和运营中,让所有新用户尽可能地体验到产品价值,从而持续地留下来。比如,当我们发现第1次消费与第2次消费相差3天的用户留存率最高时,就要通过各类运营策略引导并提醒用户在第1次消费3天后回来消费。


我们首先要明确分析目标:


影响用户留存率的关键行为有哪些?


这些行为和用户留存率的相关程度有多大?


所以业务问题可以转化为“挖掘与留存率相关的用户行为,并且把相关的程度量化”


81ea23358a3646f5a63eae3551083831.png


以直播为例进行具体的分析:


1.关键行为特征数据的提取


利用SQL从数据仓库中提取你想要的与留存率相关的数据行为。作为数据分析师,我们需要自己大概思考有哪些用户的行为会影响到用户留存率,然后把这些猜想的行为因素与相关的业务人员进行沟通,主要是从业务人员的经验角度分析用户的哪些行为大概会影响到留存率,再去完整地提取数据,这样可以保证提取的用户行为数据较为科学和完整。


e8923308b604409599ba66fe2295f6c6.png


当我们规划出大概影响用户留存率的行为时,接下来就需要把这些行为用数据指标表示出来,用数据指标来刻画这些行为。在本例子中,我们通过登录行为、观看行为、弹幕行为、和付费行为作为数据指标。


2.相关性分析


提取了和留存率可能相关的用户行为数据以后,就要挖掘与留存率相关的那些用户行为,以及把这些相关性量化。量化指的是用数字计算出来。那么,如何计算这些用户的行为和留存率的相关性大小呢?这里需要用到专业的数据分析方法,我们知道这是典型的相关性问题,所以可以采用统计学里的相关性计算方法。利用统计学的相关性计算方法,可以计算第一步中提取的每一个行为与留存率的相关性,相关性的系数越大表示这个行为与留存率越相关,就表示它可能越影响留存率。比如,用户使用产品的次数与留存率的相关系数是0.6,用户使用产品的时长和留存率的相关系数是0.8,就可以说明用户使用产品的时间和留存率更相关。


我们把上述提取的行为数据量化,指标用X表示,留存用Y表示。


importmatplotlib.pyplotasplt#导入Python包matplotlib.pyplotimportseabornassns#导入Python包seabornimportpandasaspd#导入Python包pandasretain2=pd.read_csv ( "d:/My Documents/Desktop/train2.csv" )
#读取文件的数据retain2=retain2.astype (float) #把文件的数据格式转换为float格式plt.figure (figsize= (16,10) ,dpi=80) #设置展示图的大小及字体的大小sns.heatmap ( retain2.corr () ,xticklabels=retain2.corr () .columns, yticklabels=retain2.corr () .columns,cmap='RdYlGn ' , center=0 , annot=True)
#相关图的可视化计算#Decorationsplt.title ( 'correlogram of retain' ,fontsize=22)#设置标题plt.xticks ( fontsize=12)#设置x坐标字体的大小plt.yticks ( fontsize=12#设置y坐标字体的大小plt.show( )#输出相关性分析的可视化图表


0485d05beb8a468393e767dffb459b21.png


3.因果分析


数据分析中的相关关系不一定是因果关系,假如我们只分析出使用产品的时长和留存率具有很强的关系,但我们不知道是因为用户使用产品的时间长这个因素导致了留存率高这个结果,还是因为用户留存下来,所以使用时间比较长。所以,我们需要分析哪些行为是造成用户留存率高的原因,针对这些原因进行优化和促进才可以达到提升留存率的作用。那么用什么方法分析?这个问题就是典型的因果推断方法,可以利用因果推断常用的方法:Granger Test(因果检验)。


我们需要进行下一步的分析:因果推断,利用数据科学方法分析这几个行为因素和留存哪一个是因,哪一个是果。原假设和是否拒绝:判断X和Y是否存在因果关系R。当经过格兰杰因果关系检验后计算出来的P值大于0.05时,则接受原假设,否则拒绝原假设。


72857e2e39934565b3eee8c4b193b3d5.png


它们的因果关系如下。


● 30天登录天数是留存的原因。


● 30天日均观看时长是留存的原因。


● 30天观看品类数是留存的原因。


● 30天充值次数是留存的原因,但留存不是30天充值次数的原因。


4.Aha时刻


当我们已经判断了某个行为就是用户留存率高的原因时,比如,用户一周浏览抖音短视频的时间是下一周是否会留存的原因,但是我们不知道用户达到多少时长可以促进留存。那么,接下来就是去发现到底浏览多长时间抖音短视频是留存的Aha时刻,这个Aha时刻非常神奇,比如,用户一周使用产品288分钟,下周留存的概率会大大增加,这个“一周——使用——288分钟”就是互联网中最经典的Aha时刻。抓住了Aha时刻,也就抓住了一个产品的留存灵魂。


发现了影响留存的原因以后,我们就要寻找这些行为达到一个怎样的值后,会大大影响留存率。计算30天登录天数、7天登录天数、月日均观看时长、30天观看主播数、30天观看品类数和留存的关系。


a5428ebf25604c2e8aebd4cd3d3d6430.png


Aha时刻的计算方法就是基于上图来寻找的。我们以30天登录天数作为例子,横轴是30天内不同登录天数,纵轴就是用户留存率,当横轴为7时,用户留存率趋于稳定,这时达到较稳定的状态,也被称作Aha时刻。其他的行为与Aha时刻的挖掘方法类似。我们可以发现几个神奇的留存的Aha时刻。


● 月登录4天:表明当用户的月登录天数达到4天时,会大幅增加留存。


● 周登录3天:表明当用户的周登录天数达到3天时,会大幅增加留存。


● 月观看7个主播数:表明当用户的月观看主播数达到7个时,会大幅增加留存。


● 月观看4个品类数:表明当用户的月观看品类数达到4个时,会大幅增加留存。


● 月日均观看时长4分钟:表明用户月日均观看时长达到4分钟时,会大幅增加留存。


参考内容:


一文说透用户留存:抓住有价值的留量红利


《数据分析方法和业务实战》


更多博客:


【数据分析】————面试总结


【业务数据分析】——数据指标和数据指标体系


【业务数据分析】——如何搭建数据指标体系


【业务数据分析】——十大常用数据分析方法  

目录
相关文章
|
2月前
|
数据挖掘 PyTorch TensorFlow
|
24天前
|
数据挖掘 UED
ChatGPT数据分析——探索性分析
ChatGPT数据分析——探索性分析
28 1
|
24天前
|
数据可视化 数据挖掘 数据处理
ChatGPT数据分析应用——热力图分析
ChatGPT数据分析应用——热力图分析
58 1
|
24天前
|
数据挖掘
ChatGPT在常用的数据分析方法中的应用(分组分析)
ChatGPT在常用的数据分析方法中的应用(分组分析)
50 1
|
27天前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
32 1
|
23天前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
37 0
|
24天前
|
数据挖掘
ChatGPT在常用的数据分析方法中的应用(对比分析)
ChatGPT在常用的数据分析方法中的应用(对比分析)
41 0
|
2月前
|
机器学习/深度学习 人工智能 数据挖掘
数据分析师是在多个行业中专门从事数据搜集、整理和分析的专业人员
数据分析师是在多个行业中专门从事数据搜集、整理和分析的专业人员
34 3
|
3月前
|
数据采集 算法 数据挖掘
10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
LinkedIn 对全球超过3.3亿用户的工作经历和技能进行分析后得出,目前最炙手可热的25 项技能中,数据挖掘排名第一。那么数据挖掘是什么? 数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此“数据挖掘”已成为企业保持竞争力的必要方法。 今天给小伙伴们分享的Python数据分析与数据挖掘手册是10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、
10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
|
3月前
|
数据采集 算法 数据挖掘
10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
LinkedIn 对全球超过3.3亿用户的工作经历和技能进行分析后得出,目前最炙手可热的25 项技能中,数据挖掘排名第一。那么数据挖掘是什么? 数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此“数据挖掘”已成为企业保持竞争力的必要方法。 今天给小伙伴们分享的Python数据分析与数据挖掘手册是10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、