数据分析模型-帕累托模型

简介: 从实际业务出发,如何去构建一个业务分析模型

模型构建

整个业务分析层面来讲,业务分析的对象只有三个:

产品/商品/服务),(用户/客户)、(渠道/营销/市场)。


比如说,如果你经常跟业务人员沟通,你就会发现他们的分析需求永远逃不过以上三个方面。


如果业务想让你分析毛利率下滑的原因,你觉得分析的对象是谁呢?很明显就是分析商品。再比如业务想让你构建流失漏斗,其实就是要分析用户;比如活动复盘分析、分析广告投入,本质上其实就是分析渠道。


所以我们在进行数据分析之前,也就是在确定数据分析目的时,一定要弄清楚分析对象是谁,根据不同的分析对象,我们要去取不同的数据、建立不同的数据分析模型。那么什么叫作业务分析模型呢?


很简单,分析模型就是基于指标、维度与分析方法(思维)三者的关联组合,这个分析模型是我们针对某个问题进行数据分析的框架,某一个问题我们可能需要用到非常多的数据模型,但每个模型都只能解决某一个特定问题。


下图是数据分析模型的三要素关系图,其中,维度指明了我们要从什么样的角度分析问题,比如商品、客户、渠道、时间、地区等;指标指明了我们要从这个维度分析的点,比如商品销售维度的指标包括毛利率、毛利额、周转率等;最后的分析方法代表了我们将用什么样的方法去分析和处理这个维度的指标。

image.png


电商商品模型构建

比如电商商品分析,怎么去分析产品或者商品、建立分析模型呢?

维度

首先确定我们要分析的维度有哪些,比如销售维度、用户维度、地区、时间等。


比我们要分析毛利率,进行拆解时想要看一下哪些地区的毛利率出现了问题,我们的维度就是地区维度,那么可以不断地下钻为国家、省份、城市、门店。

image.png

指标

然后确定指标,不同维度的指标是不同的,比如销售维度里有销售额、毛利、净利、毛利率、周转率、促销次数、交易次数、客单价等。


地区维度里的指标有门店类别、门店客流量、门店销量等,比如我们要看某个地区的毛利率,指标就可以定为“门店毛利额、毛利率与毛利环比”。

image.png

分析方法

最后我们再确定分析方法是什么?


比如已知某地区门店的不同毛利额,那我们是要进行对比,还是要进行细分,或者要看趋势呢?是需要进行演绎推理,还是需要进行假设?很显然,我们这里需要对不同地区的毛利额进行对比,并进行细分。

image.png


这样一个数据模型就建立好了,我们建立好了一个数据模型,就可以一直保留这个模型,任何相同的数据都可以直接放进来进行分析,以后再遇到类似问题直接套用模型即可。这就是数据分析模型的构成要素与方法了。


那么商品分析的数据一般从哪里来呢?


大多数分为两大类,一类来自销售数据,比如产品的销售额、销售量、销售价格、毛利等数据,这类数据一般是存放在订单中的,需要从销售订单里获取;另一大类来自产品基础数据,比如进价、产品类别、供应商数据、货存数据,等等,这些数据一般是业务方拿到的。

image.png


帕累托模型的构建

什么是帕累托模型呢?你一定在网上听到过下面这样的说法。


世界上 80% 的资源被 20% 的人消耗了;美国 20% 的人垄断了全国 80% 的财富;一个企业 20% 的资源投入产生了 80% 的效益......


其实这些现象的背后都存在着一个定理——二八法则(20 / 80 定理)。所谓的二八法则就是说,在任何群体当中,较少的重要因子带来了绝大多数的影响,较多的不重要因子带来了很小的影响。从数据统计的方式得到一个基准线为 20% 与 80%,即 20% 的投入往往能带来 80% 的回报。


而帕累托模型就是以二八法则为基础原理构建出的商品分析模型,这个模型最大的好处是可以对商品或者产品进行分类,按照投入产出比的优先次序原则,将自己的资源尽量投入到头部产品当中,以期产生最大的效益!

比如电商商品分析,怎么去分析产品或者商品、建立分析模型呢?


比如说典型的资源分配问题,某家零售电商企业旗下有 10 款产品,每款产品的销售效益是不一样的,最近企业的盈利增长受阻,想要调整一下产品的资源投入情况,作为数据分析师的你应该如何划分呢?


这时候就要用到帕累托模型了,首先我们按照上面讲解的模型建立流程,确认模型的维度、指标与分析方法分别是什么,如下所示:


维度:产品销售


指标:毛利率、销售额


分析方法:累计对比


目录
相关文章
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!
【10月更文挑战第4天】Scikit-learn凭借高效、易用及全面性成为数据科学领域的首选工具,简化了数据预处理、模型训练与评估流程,并提供丰富算法库。本文通过实战教学,详细介绍Scikit-learn的基础入门、数据预处理、模型选择与训练、评估及调优等关键步骤,助你快速掌握并优化数据分析与机器学习模型。从环境搭建到参数调优,每一步都配有示例代码,便于理解和实践。
105 2
|
7月前
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(上)
大模型与数据分析:探索Text-to-SQL(上)
3598 0
|
7月前
|
SQL 自然语言处理 数据挖掘
大模型与数据分析:探索Text-to-SQL(中)
大模型与数据分析:探索Text-to-SQL(中)
1246 0
|
4月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
110 2
|
4月前
|
机器学习/深度学习 前端开发 数据挖掘
基于Python Django的房价数据分析平台,包括大屏和后台数据管理,有线性、向量机、梯度提升树、bp神经网络等模型
本文介绍了一个基于Python Django框架开发的房价数据分析平台,该平台集成了多种机器学习模型,包括线性回归、SVM、GBDT和BP神经网络,用于房价预测和市场分析,同时提供了前端大屏展示和后台数据管理功能。
123 9
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
【python】python母婴数据分析模型预测可视化(数据集+论文+PPT+源码)【独一无二】
【python】python母婴数据分析模型预测可视化(数据集+论文+PPT+源码)【独一无二】
|
5月前
|
机器学习/深度学习 算法 数据挖掘
从零到精通:Scikit-learn在手,数据分析与机器学习模型评估不再难!
【7月更文挑战第25天】在数据科学中,模型评估是理解模型泛化能力的关键。对新手来说,众多评估指标可能令人困惑,但Scikit-learn简化了这一过程。
61 2
|
4月前
|
机器学习/深度学习 搜索推荐 数据挖掘
【深度解析】超越RMSE和MSE:揭秘更多机器学习模型性能指标,助你成为数据分析高手!
【8月更文挑战第17天】本文探讨机器学习模型评估中的关键性能指标。从均方误差(MSE)和均方根误差(RMSE)入手,这两种指标对较大预测偏差敏感,适用于回归任务。通过示例代码展示如何计算这些指标及其它如平均绝对误差(MAE)和决定系数(R²)。此外,文章还介绍了分类任务中的准确率、精确率、召回率和F1分数,并通过实例说明这些指标的计算方法。最后,强调根据应用场景选择合适的性能指标的重要性。
622 0
|
5月前
|
数据采集 机器学习/深度学习 数据挖掘
Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
|
5月前
|
数据采集 机器学习/深度学习 数据可视化
关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理,进行数据探索,选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。
【7月更文挑战第5天】这是一个关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理(填充缺失值,处理异常值),进行数据探索(可视化和统计分析),选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。此案例展示了数据科学的典型流程。
87 2