数据分析方法与模型

简介: 数据分析方法与模型

本文来源,为接地气的陈老师的知识星球,以及付同学的观看笔记。


1 数据分析


分析方法,即从数据中得出有业务意义的结论。


1.1 占比分析

通过各品类在总体中所占的百分比获取信息

如,核心指标是直播间数量的分析:

d48b984da23567b21db22473269797d5_9b8f83da1bc34582bdad3041324d9d32.png


从占比可以看出,个人管理类的直播间最受欢迎,其中创业商业类最受关注。职业教育占比极少,是一个蓝海。


1.2 趋势分析

通过观察事物的发展趋势,可以推理出产生此现象的原因、给出解决方案等。

如,全年的直播观看次数变化趋势:

8475927cfea52678dc7142948c67d572_bb43b1ec359d46cc889d8ae8a4bed385.png


一月份总体观看人数最少,其原因是年底直播的人数较少,中后期有一个大幅度的下滑是在过年期间。一月底到二月初,由于线上复工,直播数量增多,直播观看次数也陡增。二月、三月期间,由于一部分不喜欢看直播或者一部分人喜欢上了看直播,所以变化的浮动比较大。清明公祭期间全面禁娱,因此观看人数为零。到后期之后,直播间数量及观看人数趋于稳定。


1.3 对比分析

跟自己比:同比、环比

跟其他比:在整个行业中的市场份额、与竞对方对比优劣

24889aa96c16af539b2662076a48bc0c_d99cf896623c464b9b80056871f275bb.png


个人管理类门槛较低,因此数量最多,竞争力也最大,导致增长率不高。职业教育类门槛较高,因此数量最少,但是增长率是最高的。


1.4 象限分析

分群策略:用两个以上核心指标将业务对象按照象限划分

如,直播间观看次数与时长:

f5a6ec2d0947bc458330cee46deccf3f_fb94b3ee46b14d41ab76484d3f067e87.png


以整体平均为坐标原点,第一象限中观看的时长更长、观看次数更多、观看人数更多,第三象限中观看的时长较少、观看的次数较少、观看的人数较少,第二、四象限中没有数据。观看时长与观看次数大致是呈正比关系。第一象限中的品类时长更长,由此可见,这些品类的体系较为完整,观看时长提升了,观看次数和观看人数自然会增多。相反,第三象限中的品类时长较少,相应地,观看次数与人数自然会更少。

在提出解决方案时可对其进行更细粒度的展开,找出每个品类的更细品类(二级品类),通过分析二级品类的观看次数与直播间数的现象分析,找出用户的兴趣偏好与需求,可以适当砍掉直播间数多但是观看次数少的直播间,适当增加观看次数多但是直播间数量少的直播间。


1.5 排名分析

类似二八定律,及百分之八十的财富由百分之二十的人创造。运用到数据分析中,可以观察排名数据的帕累托图,长尾效应越明显,则该数据越是不健康,说明资源不平均,面对的风险越大。


1.6 维度分析

维度作为趋势、对比、占比等分析的关键因子,其粒度越小,越能找出问题的关键所在,越容易找出解决问题的方案。

如,常见业务的维度:

一级品类:职业、兴趣等

二级品类:职业可分哪些,兴趣又可分为哪些

常见的指标:

TGI指数(Target Group Index) = (目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例) * 100

7d187e5a7a1b7374e898e4b944e12d37_3cf18bd4b4f04260a74a4eece544291d.png


意义:100代表平均水平,高于100,代表该类用户对某类问题的关注程度高于整体水平。


2 分析模型


2.1 费米问题-大致估算

面试中的常见开放问题,比如北京有多少加油站,需要做到有理有据,有大致的参数和估算方法。

前提要具备基本的数据常识,如面积、人口数、物价等

根据供需关系可以解决80%的费米问题,此外,还可以考虑空间关系、收入关系、时间关系。

从供需关系入手:假设加油站满足需求,从人口数推出车辆数,再由加油时长、加油站工作时间、平均站桩、油桩利用率可推出加油站的供给能力,由车辆和加油频率算出加油站每天的需求,最后可得出加油站数。(也涉及时间关系)

cb46a908bc0fb958f93d91e003a21d07_b1f7a9eba15b4e009953a80c8955674e.png


从空间关系进行分析:

a16decb91fc12025dabfa95ad7311975_0b72adbed1ab48a08c8b4e2d84a5c30a.png


从收入关系进行分析:

e0948ba310cc5435d0d9596a1db04eb4_f86595f0e0544d688c9a3d67ad34e6ea.png


2.2 七问分析法-思考角度的拓展

面试中常见的开放题,对应问题:要如何做?

七问(5w2h):

what:是什么,目的是什么

why:为什么,为什么要这样做,原因是什么,造成这样的结果为什么

when:何时,什么时间完成,什么时机最合适

where:何处,在哪里做,从哪入手

who:谁,由谁来承担,谁来完成,谁负责

how:怎么做,如何提高效率,如何实施,方法怎样

how much:多少,做到什么程度,数量如何,质量水平怎么样,费用产出如何

案例:


你们现在准备一个电动汽车上市的推广策划,预算是20w,一个月的时间准备,你会怎样规划?(面试时注意有效的合理沟通提问)

1.信息较少时可以向面试官提问

汽车定价(20w)、产品定位、产品特色(更节能经济)、技术(续航更久、充电更快)、外观、目标用户画像(工作了3-5年的1、2线白领,男性居多,有3台车可在推广时使用)

2.使用5w2h进行问题拆解

what主题内容:电动、环保

why活动目的:拓展年轻群体对电动汽车的认知,培养种子用户

who人员:内部:根据内部人员情况,做好工作分配安排;合作方:提前联系并确认好供应商、合作媒体、宣传资源

when活动时间:配合上市时间,推广时间在上市前两周,为上市做好预热

where渠道:制作宣传视频并投放,与商场合作开设试驾点,后期宣传

how方式:对工作进行细化

how much:分配预算


2.3 互联网通用模型AARRR、八角分析法

2.3.1 AARRR

分析用户如何增长?如何提高留存?如何分析一个APP?

AARRR模型:

73ea97f8b0ead206c6c0a25dd0ba9850_96f4ee2459fc4f7396207082bbe5ba14.png


2.3.2 游戏化用户增长策略-八角模型

使命:赋予用户游戏的使命与意义(蚂蚁森林)。

成就:达成某个规则后获得物质(证书)。

创造:英雄联盟100多个英雄角色。

所有权:线上种树种出的果实可以寄给你(拼多多种树)。

社交:用户在游戏中找到圈子。

未知与好奇:盲盒、抢红包。

亏损:给用户不来就亏了的感觉(拼多多砍一刀)。

稀缺:限定

拼多多的砍一刀是典型的八角模型。

相关文章
|
4月前
|
机器学习/深度学习 数据采集 数据挖掘
实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!
【10月更文挑战第4天】Scikit-learn凭借高效、易用及全面性成为数据科学领域的首选工具,简化了数据预处理、模型训练与评估流程,并提供丰富算法库。本文通过实战教学,详细介绍Scikit-learn的基础入门、数据预处理、模型选择与训练、评估及调优等关键步骤,助你快速掌握并优化数据分析与机器学习模型。从环境搭建到参数调优,每一步都配有示例代码,便于理解和实践。
152 2
|
1月前
|
数据采集 SQL 数据挖掘
电商数据分析的方法
电商数据分析涵盖从业务需求理解到数据呈现的全流程。初学者应循序渐进,掌握数据清洗、转换等技能,Python是重要工具。社交媒体营销分析关注用户参与度和KOL影响。实战教程如《2019电商数据分析师实战项目》提供Excel、SQL及Tableau应用案例,帮助巩固理论知识。代码示例展示了如何使用Pandas和SQLAlchemy进行销售数据分析,计算转化率。 (注:联系方式和感谢语已省略以符合要求)
电商数据分析的方法
|
3月前
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
252 1
|
4月前
|
数据挖掘
ChatGPT在常用的数据分析方法中的应用(分组分析)
ChatGPT在常用的数据分析方法中的应用(分组分析)
96 1
|
4月前
|
数据挖掘 数据处理
ChatGPT在常用的数据分析方法中的应用(交叉分析)
ChatGPT在常用的数据分析方法中的应用(交叉分析)
77 1
|
4月前
|
数据挖掘
ChatGPT在常用的数据分析方法中的应用(对比分析)
ChatGPT在常用的数据分析方法中的应用(对比分析)
84 0
|
5月前
|
SQL 数据采集 数据可视化
数据分析的方法
数据分析的方法
143 3
|
6月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
147 2
|
6月前
|
机器学习/深度学习 前端开发 数据挖掘
基于Python Django的房价数据分析平台,包括大屏和后台数据管理,有线性、向量机、梯度提升树、bp神经网络等模型
本文介绍了一个基于Python Django框架开发的房价数据分析平台,该平台集成了多种机器学习模型,包括线性回归、SVM、GBDT和BP神经网络,用于房价预测和市场分析,同时提供了前端大屏展示和后台数据管理功能。
138 9