请问机器学习算法岗中用户增长和推荐系统差别是什么呢?(一)

简介: 请问机器学习算法岗中用户增长和推荐系统差别是什么呢?(一)

看到这个问题,不由得想起我当初了解用户增长的时候,在网上一搜,发现用户增长的文章往往伴随漫天的黑话、方法论、金字塔、导图,心灵大受震撼的场景。


两者的差别用一句话来说就是,在用户生命周期的部分阶段两者有重叠,除了推荐算法外,用户增长在别的阶段还有一些不同算法应用。


这里从算法角度简单拆解一下用户增长算法的方向,帮助算法同学简单清晰地梳理下用户增长究竟是做什么的。但增长方向内容实在很多,我不能面面俱到,仅做个参考。


做用户增长,顾名思义,岗位负责最核心指标是用户数量。所以用户增长一般做的事情都要能够直接间接影响到 DAU。所以用户增长逻辑上很清晰:围绕用户的生命周期寻找优化点。但是因为链路过长,落实到技术上,会显得有些分散。


一般地,我们把用户的生命周期可以分解成如下几个阶段:


  • APP 外


  • 获客阶段:指如何获取新用户;


  • APP 内


  • 激活阶段:指将新用户从APP视角的空白用户激活成活跃用户;


  • 活跃阶段:用户在APP内处于比较活跃的阶段;


  • 沉默阶段:用户减少使用APP频率至比较低的水平;


  • APP 外


  • 流失阶段:用户卸载或者不再使用APP;


其中,进入到 APP 内阶段以后,用户增长和推荐算法就有比较大的重叠了。简单配张图。


c98f46de0e5af30cf65b914eadd3ec54.png


1. 获客阶段


一般 APP 的获客阶段粗略地分,可以分成自然流量和购买的流量。自然流量指的是用户自发地安装产品,成为用户,通常占比较小。购买的流量一般指广告外投或者OEM预装等渠道,通过花钱购买曝光和安装,通常占比较大。


购买效果广告流量的场景,通常是这样的:


需要一些系统中的优秀 item 作为素材去外界平台投放广告,吸引用户点击广告并下载


有多种广告投放平台可选,这些平台的曝光价格(eCPM)不一而足,效果也不尽相同


随着时间增加,种子用户都已经有了广告曝光,剩下的用户点击率和转化率逐渐走低,获客成本逐渐增加


对这样动态的过程,算法是可以有一定介入能力的。算法可以做和需要做的事情包括:


  • 种子 item 的选取:决定什么样的 item 可以作为外投广告的 item。


  • **创意生成:**因为效果广告是千人前面的,每个人看到的广告都不一样,因此广告外投的展现形式是什么样子的也需要算法生成,这个样式一般叫创意。有的广告平台有生成创意的功能,有的则由广告主自行生成。下图是京东在某 APP 投放的开屏广告,尚不清楚是广告平台还是京东自己生成的,但可以确定是算法生成的,因为我在京东搜索了一圈,冰箱品类并没有“TC”这个品牌,看起来是 TCL 的品牌识别出了点问题。


  • ROI、留存 和 LTV(lifetime value) 预估:由于外投流量是有成本的,我们需要预估买到新用户的长期留存和 life-time 的收益。当这个收益能够 cover 流量成本的时候,即 ROI > 1 时,我们认为是比较健康的,当 ROI 远小于 1 的时候,意味着外投获客是烧钱行为,不能够长久。这是时间序列问题。


对提升自然流量,算法侧一般的思路是增加 APP 的站外曝光量,如通过算法模型提高站外分享率等。




京东在某APP投放的开屏广告,可惜TCL拼错了


2. 激活阶段


从这个阶段开始,用户就进入到了产品内部,做的事情和推荐算法逐渐一致。激活阶段是用户增长最重要的阶段。它的重要性体现在几个方面:


第一,新用户刚来,几乎一张白纸,给新用户做推荐是极有挑战性的;


第二,新用户的耐心有限,能不能在很短的时间窗口内把 APP 的价值体现给用户,很大程度上决定了用户会不会留下;


第三,给新用户确立完整无偏的用户画像很重要,如果在最开始给用户定性定错了,短期留存必然上不去,许多产品对新用户会更多推热门 item,因为这些 item 的点击率相对更高,但热门 item 有时并不代表兴趣,如果没有考虑这点,新用户的画像就会学偏,这个用户从一开始就走向了流失。


这个阶段算法需要考虑的问题包括:


新用户承接:用户如果通过广告来的,则他进 APP 是带有一定目的性的,需要针对性地进行信用的承接


新用户推荐:


在没有用户画像时如何给新用户做推荐?


如何给新用户做推荐,能够尽快确立无偏的用户画像?


新用户激活:


如何让用户尽快积累点击或者展现,成为活跃用户?


这个阶段的策略和一般推荐算法最大的区别在于,它们不是 ctr 为目标的,而是以新用户的留存为主要目标进行优化的。这也是这一阶段另一个难点,留存不能直接优化,往往需要结合业务的 sense 或代理指标进行优化。


相关文章
|
4月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
216 6
|
10天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
|
6天前
|
人工智能 编解码 算法
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
|
2月前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
382 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
解锁机器学习的新维度:元学习的算法与应用探秘
元学习作为一个重要的研究领域,正逐渐在多个应用领域展现其潜力。通过理解和应用元学习的基本算法,研究者可以更好地解决在样本不足或任务快速变化的情况下的学习问题。随着研究的深入,元学习有望在人工智能的未来发展中发挥更大的作用。
|
2月前
|
机器学习/深度学习 算法 网络安全
CCS 2024:如何严格衡量机器学习算法的隐私泄露? ETH有了新发现
在2024年CCS会议上,苏黎世联邦理工学院的研究人员提出,当前对机器学习隐私保护措施的评估可能存在严重误导。研究通过LiRA攻击评估了五种经验性隐私保护措施(HAMP、RelaxLoss、SELENA、DFKD和SSL),发现现有方法忽视最脆弱数据点、使用较弱攻击且未与实际差分隐私基线比较。结果表明这些措施在更强攻击下表现不佳,而强大的差分隐私基线则提供了更好的隐私-效用权衡。
62 14
|
3月前
|
算法
PAI下面的gbdt、xgboost、ps-smart 算法如何优化?
设置gbdt 、xgboost等算法的样本和特征的采样率
118 2
|
4月前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
89 1
|
11天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GRU网络的MQAM调制信号检测算法matlab仿真,对比LSTM
本研究基于MATLAB 2022a,使用GRU网络对QAM调制信号进行检测。QAM是一种高效调制技术,广泛应用于现代通信系统。传统方法在复杂环境下性能下降,而GRU通过门控机制有效提取时间序列特征,实现16QAM、32QAM、64QAM、128QAM的准确检测。仿真结果显示,GRU在低SNR下表现优异,且训练速度快,参数少。核心程序包括模型预测、误检率和漏检率计算,并绘制准确率图。
83 65
基于GRU网络的MQAM调制信号检测算法matlab仿真,对比LSTM
|
2天前
|
机器学习/深度学习 数据采集 算法
基于PSO粒子群优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目展示了基于PSO优化的CNN-LSTM-SAM网络时间序列预测算法。使用Matlab2022a开发,完整代码含中文注释及操作视频。算法结合卷积层提取局部特征、LSTM处理长期依赖、自注意力机制捕捉全局特征,通过粒子群优化提升预测精度。适用于金融市场、气象预报等领域,提供高效准确的预测结果。

热门文章

最新文章