数据分析10大经典模型

简介: 数据分析10大经典模型

1.帕累托分析


所谓的帕累托分析“二八定律”,在任何一组东西中,最重要的只占其中一小部分,其余尽管是多数,却是次要的。例如公司要撤销一部分商品时,就可以优先选择撤销次要商品。


根据事物的主要特征,进行分类排队,把被分析的对象按照占比分成 A、B、C 三类(可根据实际需求按照不同的比例分成多类),从而分清重点和一般,有区别地确定管理方式。

6c6f29b03e3626488e17397bc62f9578_5f784c5763d73da1f5a64bc59a86609a.png


上图通过组合图综合展现品牌销售额情况。按照0-80% A类,80%-90% B类,90%-100% C类进行划分,得出结论:


A 类商品:ZIPPO、PAW IN PAW、NEW BALANCE、HANG TEN


B 类商品:SINOMAX、O.C.T.MAMI


C 类商品:WHO.A.U、RACB JJQN、LESPORTSAC、X.ZHINING


所以A类商品为主要商品,C类商品为次要商品,公司在做业务调整时,可优先撤销C类商品。


2.RFM客户分析模型


RFM模型是衡量客户价值和客户创利能力的重要工具和手段,其通过以下三个关键指标对客户进行观察和分类,针对不同的特征的客户进行相应的营销策略:


最近一次消费时间(R)


客户距离最近的一次采购时间的间隔,考察客户购买的沉默期。


最近一段时间内消费频次(F)


指客户在限定的期间内所购买的次数,考察客户的忠诚度。


最近一段时间内消费金额(M)


客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。


此外还可计算客户消费能力与消费流失情况:


02c5962f3556e2c7201126ae2c02fcb9_2a1c224ed8ffc07fb68db8a4950a0a42.png

由于M、F 为正向指标,则用M、F作为横纵轴代表客户消费的能力,值越大表示消费能力越高;R为负向指标,则代表消费流失情况,图形越大表示最近消费距今时间越长,流失越严重。


3.同环比分析


同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比的相对发展速度。


环比表示连续2个统计周期(比如连续两月)内的量的变化比。


计算公式


同比:(本期销售额-去年同期销售额)/去年同期销售额


环比:(本期销售额-上个周期销售额)/上个周期销售额


4.留存分析


留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中,经过一段时间后仍然存在客户行为(如登录、消费)的人数。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。


留存率:


当日留存率:当日激活并登录用户数/所有登录用户


一周留存率:初次激活日为维度,计算“激活-登录时间差”为 1-7 的登录用户数/所有登录用户数


两周留存率:初次激活日为维度,计算“激活-登录时间差”为8-14的登录用户数/所有登录用户数


三周留存率: ......


留存率中有一个重要的指标就是活跃用户即UV,只有活跃才会产生用户粘性,用户才会留存。


5.转化分析


转化分析的本质是为了促进企业的核心业务的流通,最大化每个营销漏斗的转化率。


三个转化:


阶段转化:对于需要进行逐级转化的平台运营,首先可以通过用户转化漏斗图进行宏观的流程转化数据分析找出目前阶段最需要优化的运营环节和平台,有效地进行针对性治理,最终提高整体平台用户转化率。

0f5436b7d0ab37b0ebc7455670c51175_914904397b7567c4e4ab9a4d68ec7d72.png


事件转化:通常指的是平台或商铺通过一系列的运营推广活动以及由于公共事件影响所带来的额外价值,通常可关注于营销渠道转化率等指标进行活动的推广营销效果评估。


服务转化:通常用户在网上购买商品时,良好的服务自然能够提高顾客的购买率,对于平台的客户人员,可以统计出其咨询到下单的节点转化情况,并且以咨询到下单的转换率指标作为KPI指标之一来评价客服人员的工作绩效。


6.杜邦分析


杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

5390d97c94fd5558cba7316de08f224c_7de400d6a843ffc9aab8e043e9714f51.png


净资产收益率受三类因素影响:


净利润率:用销售净利润率衡量,表明企业的盈利能力。


销售净利润率=净利润/销售收入


总资产周转率:用资产周转率衡量,表明企业的运营能力。


资产周转率=销售收入/总资产


财务杠杆:用权益系数衡量,表明企业的资本结构。


权益系数=总资产/净资产=1/(1-资产负债率)


杜邦分析公式:净资产收益率(ROE)=销售净利率*资产周转率*权益乘数


7.商品关联分析法


通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,叫做商品关联分析法,也叫做“购物篮分析”。


支持度(support):是对关联规则重要性的衡量。


定义:支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。


5a9a41003d1e4e14ccb22f5efd66ac2b_46f242fa9bce627d9f8218946ae9fe71.png


支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。


置信度(confidence):是对关联规则的准确度的衡量。


定义:置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。


9239b2da69e0073adfdd351c4f00c29e_3a2fe36909e72a45ffc63099c5d3b63f.png


提升度(lift)


定义:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。


4622fc07d3cea2fd091f32e1f6a9bdf0_00dbc10497ea9baffa0673f14bab9f45.png


8.需求分析


需求分析又称为KANO 模型法。


KANO 模型由满意系数和不满意系数来衡量:


Better:满意系数,代表如果产品提供某种功能或服务,用户满意度会提升。Better值越大/越接近1,则表示用户满意度提升的效果会越强。


Worse:不满意系数,Worse的数值通常为负,代表产品如果不提供某种功能或服务,用户的满意度会降低。其绝对值越接近1,则表示对用户不满意度的影响最大


根据需求类型可以又分为以下四种:


兴奋型需求: 属于惊喜型产品功能,超出用户预期,往往能带来较高的忠诚度。若不提供此需求,用户满意度不会降低;若提供此需求,用户满意度会有很大的提升。


期望型需求:当提供此需求,用户满意度会提升;当不提供此需求,用户满意度会降低。通常作为竞品之间比较的重点。


必备型需求:所谓痛点。对于用户而言,这些需求是必须满足的,理所当然的。


当不提供此需求,用户满意度会大幅降低。对于这类需求,是核心需求,也是产品必做功能。


无差异需求:用户根本不在意的需求,对用户体验毫无影响。这类需求可以不用做。


根据两个指标以及四种需求类型可以得到better-worse 四象限分布图:

e6e3786ede48793f283c6be89be1836a_378f621d17be89ddd1b982ae62c2200a.png


9.复购分析


复购分析用来说明用户的忠诚度,以复购率作为指标来衡量,复购率可以分为“用户复购率”和“订单复购率”。


用户复购率=单位时间内:购买两次及以上的用户数/有购买行为的总用户数


订单复购率=单位时间内:第二次及以上购买的订单个数/总订单数


此外,“用户回购率”意义与复购率相似,其计算公式为:


用户回购率=单位时间内:有购买行为的老用户数/有购买行为的总用户数


10.用户画像


用户画像即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。


用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。


例如xx公司ARPU(用户平均收入)9.57元,用户平均年龄38岁,在网时长108,249。


男性用户占比63%,20-30岁人数占比最大:19.33%,20-30岁用户收入占比最大,占总收入的30%


目录
相关文章
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!
【10月更文挑战第4天】Scikit-learn凭借高效、易用及全面性成为数据科学领域的首选工具,简化了数据预处理、模型训练与评估流程,并提供丰富算法库。本文通过实战教学,详细介绍Scikit-learn的基础入门、数据预处理、模型选择与训练、评估及调优等关键步骤,助你快速掌握并优化数据分析与机器学习模型。从环境搭建到参数调优,每一步都配有示例代码,便于理解和实践。
80 2
|
6月前
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(上)
大模型与数据分析:探索Text-to-SQL(上)
3153 0
|
6月前
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(中)
大模型与数据分析:探索Text-to-SQL(中)
1120 0
|
3月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
90 2
|
3月前
|
机器学习/深度学习 前端开发 数据挖掘
基于Python Django的房价数据分析平台,包括大屏和后台数据管理,有线性、向量机、梯度提升树、bp神经网络等模型
本文介绍了一个基于Python Django框架开发的房价数据分析平台,该平台集成了多种机器学习模型,包括线性回归、SVM、GBDT和BP神经网络,用于房价预测和市场分析,同时提供了前端大屏展示和后台数据管理功能。
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
【python】python母婴数据分析模型预测可视化(数据集+论文+PPT+源码)【独一无二】
【python】python母婴数据分析模型预测可视化(数据集+论文+PPT+源码)【独一无二】
|
4月前
|
机器学习/深度学习 算法 数据挖掘
从零到精通:Scikit-learn在手,数据分析与机器学习模型评估不再难!
【7月更文挑战第25天】在数据科学中,模型评估是理解模型泛化能力的关键。对新手来说,众多评估指标可能令人困惑,但Scikit-learn简化了这一过程。
55 2
|
3月前
|
机器学习/深度学习 搜索推荐 数据挖掘
【深度解析】超越RMSE和MSE:揭秘更多机器学习模型性能指标,助你成为数据分析高手!
【8月更文挑战第17天】本文探讨机器学习模型评估中的关键性能指标。从均方误差(MSE)和均方根误差(RMSE)入手,这两种指标对较大预测偏差敏感,适用于回归任务。通过示例代码展示如何计算这些指标及其它如平均绝对误差(MAE)和决定系数(R²)。此外,文章还介绍了分类任务中的准确率、精确率、召回率和F1分数,并通过实例说明这些指标的计算方法。最后,强调根据应用场景选择合适的性能指标的重要性。
401 0
|
4月前
|
数据采集 机器学习/深度学习 数据挖掘
Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
239 4
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理,进行数据探索,选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。
【7月更文挑战第5天】这是一个关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理(填充缺失值,处理异常值),进行数据探索(可视化和统计分析),选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。此案例展示了数据科学的典型流程。
74 2
下一篇
无影云桌面