前言
数据分析个人认为可以算是逻辑思维的分流强化型应用,了解了逻辑和基本思维方法其他方法基本大同小异,有些许其区别。个人最近有些空闲时光正好抓紧学习一波数据分析基本思维做建模的时候好思维逻辑清晰。本文仅供参考。
一、数据分析的基本概念
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
1.数据分析主要包括:
描述性统计分析
频数分析
相关性分析
(偏)自相关分析
单因素方差分析
多因素方差分析
描述性统计
正态性检验
协方差分析
偏相关分析
Ridit分析
事后多重比较
探索性数据分析
汇总统计
可视化
验证性数据分析
单样本z 检验
单样本t检验
双样本t检验
定性数据分析
折叠德尔菲法
折叠质量分析法
折叠吸引力指数
离线数据分析
在线数据分析
二、数据分析必须掌握的能力
数据思维
业务知识
Excel
数据可视化
SQL
统计学习
Python、R
1.结构层次
底层数据的收集/产品端收集
数据业务化/产品需要什么样的数据
数据决策和执行/怎么让产品更好
数据模型/产品开始自动化和系统化的运营
数据战略/指导未来
2.数据分析流程-一般框架图
3.数据分析的三种核心思维
三种核心思维
结构化(结构化思维是指在思考分析解决问题时,以一定的范式、流程顺序进行,首先以假设为先导,对问题进行正确的界定,假设并罗列问题构成的要素,其次对要素进行合理分类,排除非关键分类,对重点分类进行分析,寻找对策,制订行动计划。其是一种思维方式,同时也是一管理方法)
公式化(例如:程序=数据结构+算法)
业务化(将如上方法结合,贴近业务)
三、数据分析方法
1.常用的分析方法:
象限法
包括二维平面,三维立体。
假设法
启发思考驱动思维
对比法
一种挖掘数据规律的思考方法
二八法
一种只抓重点的思维
20%的变量将产生80%的效果
指数法
业务各类名词指标
线性加权、反比例、log法
一种目标驱动的思维
多维法
包括钻取、上卷、切片、切块、旋转等各种方法。
漏斗法
一种流程化思考方式
漏斗图模型
2.数据分析方法:
5W2H分析法(WHAT+WHY+WHEN+WHERE+WHO+HOW+HOW MUCH)
步骤(1)做什么(What)?
条件是什么?哪一部分工作要做?目的是什么?重点是什么?与什么有关系?功能是什么?规范是什么?工作对象是什么?
步骤(2) 怎样(How)?
怎样做省力?怎样做最快?怎样做效率最高?怎样改进?怎样得到?怎样避免失败?怎样求发展?怎样增加销路?怎样达到效率?怎样才能使产品更加美观大方?怎样使产品用起来方便?
步骤(3)为什么(why)?
为什么采用这个技术参数?为什么不能有响声?为什么停用?为什么变成红色:为什么要做成这个形状?为什么采用机器代替人力?为什么产品的制造要经过这么多环节?为什么非做不可?
步骤(4)何时(when)?
何时要完成?何时安装?何时销售?何时是最佳营业时间?何时工作人员容易疲劳?何时产量最高?何时完成最为时宜?需要几天才算合理?
步骤(5)何地(where)?
何地最适宜某物生长?何处生产最经济?从何处买?还有什么地方可以作销售点?安装在什么地方最合适?何地有资源?
步骤(6) 谁(who)?
谁来办最方便?谁会生产?谁可以办?谁是顾客?谁被忽略了?谁是决策人?谁会受益?
步骤(7)多少(How much)?
功能指标达到多少?销售多少?成本多少?输出功率多少?效率多高?尺寸多少?重量多少?
逻辑树析法(逻辑树是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。)
行业分析方法(标准行业分类法和道-琼斯分类法。)
PEST分析方法(政策(policy)、经济(Economy)、社会(Society)、技术(Technology)
社会环境主要包括一个地区的入口、年龄、收入、分布、购买习惯、教育水平等。
多维拆解分析法
对比分析法
数据整体的大小:平均数、中位数
数据整体的波动:变异系数
趋势变化:时间折线图,环比和同比
假设检验分析法
假设检验分析法是一种使用数据来决策的过程
1.提出假设 2.收集数据 3.得出结论
相关分析法
“相关系数”就是用来衡量两种数据之间的相关程度,通常用字母r来表示相关系数。
群组分析法
是按某个特征,将数据分为不同组,然后比较各组的数据。
RFM分析法
最近一次消费(Recency)
消费频率(Frequency)
消费金额(Monetary)
- AARRR分析法
- 1.获取用户->2.激活用户->3.提高留存率->4.增加收入->5.推荐
- 漏斗分析方法
漏斗分析的作用是“定位问题节点”,找到出问题的业务环节在哪。
漏斗分析常用于用户转化分析、用户流失分析
漏斗分析中两个指标:用户转化和用户流失。