从5W2H数据分析方法论谈起

简介: 看了小蚊子的书,里面有一个例子让我印象很深刻: 数据分析员对公司的某个业务进行了专项研究。每当完成专题分析向老板汇报分析结果是,老板首先问:“你的分析方法论是什么?将给我听听,我看分析报告就首先看你的分析方法论,如果分析方法论不正确或者不合理,那后面的分析结果也就没有必要看了,在一个不正确或者不合理的方法论的指导下,得到的分析结果是不可能正确的”。

看了小蚊子的书,里面有一个例子让我印象很深刻:

数据分析员对公司的某个业务进行了专项研究。每当完成专题分析向老板汇报分析结果是,老板首先问:“你的分析方法论是什么?将给我听听,我看分析报告就首先看你的分析方法论,如果分析方法论不正确或者不合理,那后面的分析结果也就没有必要看了,在一个不正确或者不合理的方法论的指导下,得到的分析结果是不可能正确的”。

数据分析方法论主要用于指导数据分析师进行一个完整的数据分析,更多的是指数据分析的思路。从宏观角度指导如何进行数据分析,也就是说它是一个数据分析的前期规划,指导后期数据分析工作的开展。数据分析法则是具体的分析方法,比如对比分析,交叉分析,相关分析,回归分析,聚类分析则是具体的数据分析法。数据分析法主要是从微观的角度指导如何进行数据分析。

今天说一个5W2H分析法

5W2H分析法是以五个W开头的英语单词和两个H开头的英语单词进行提问,从回答中发现解决问题的线索,即Why,What,Who,When,Where,How,How much,这就是5W2H的分析法构架。

其实这个方法在我们做任何事时都是可以使用的。他可以弥补我们考虑问题时的疏漏。

比如使用5W2H分析法来分析网游用户的购买行为。

在确定使用5W2H分析法后,根据分析框架中的这些问题形成可量化的指标进行衡量和评价,例如月均购买次数、人均购买量,再次购买平均间隔时长等。

在我们确定了上述的方向和方法后,下一步才是使用具体的数据分析法,并且我们要结合数据进行分析。

事实上,每个方面都需要进行细化和分析,甚至要细化到每一条具体的购买记录或者充值记录,所谓的宏观的数据指标我们只能大概清楚了解问题,然而解决问题就必须细化到每个具体的数据点。真正的数据价值也就在于此,永远停留在表层的宏观数据是不能创造更多的知识和价值,数据挖掘为什么说是挖掘,挖掘的含义就在于,数据分析人员穿过了表层的宏观数据,挖掘每条记录背后的秘密。

所有的宏观数据,基本上每一个DBA都能给的出来,但是同样利用数据,分析人员通过挖掘技术和分析方法论的指导渗透到每条数据,依据需求给出数据的另一面。这就是在微观层面上数据的价值,而这也是数据挖掘应用在数据上的价值,尤其是当我们以后面临big data ,这种方式不仅较少了我们读取文件,分析文件的时间,有效分析方法论,有效分析手段,依据需求,模块化的得出某些需求下的具体结论。

相关文章
|
数据挖掘
分享五个常用的数据分析方法论,让你的数据分析报告更上一层楼~
如果你在做数据分析的时候,发现自己常常不知道从哪些维度去开展分析或者分析出来的报告总感觉逻辑上不连贯,内容上不完整,那么你一定是缺乏一个合适的数据分析方法论来指导你进行数据分析。
706 0
分享五个常用的数据分析方法论,让你的数据分析报告更上一层楼~
|
数据采集 SQL 人工智能
google数据分析方法论
写在前面作为开发同学,年初至今做了4个多月的数据分析工作,从刚开始的无从下手,到后来输出多个核心报表,解决了多个实际问题。这一路走来,的确有蛮多的心路历程,也积累了一些方法论。在此分享给同在数据分析路上摸索的小白同学。参考书籍:谷歌数据分析方法文章宗旨摒弃旧的思维模式,重新审视网络决策过程。更多的关注精确度,而不是准确度附:odps sql指令大全。(含示例数据构建,可以轻松学习各种用法)核心观点
266 1
|
新零售 大数据 数据挖掘
|
18天前
|
机器学习/深度学习 数据采集 数据挖掘
如何用Python进行数据分析?
【6月更文挑战第13天】如何用Python进行数据分析?
119 66
|
4天前
|
数据可视化 数据挖掘 知识图谱
精选:15款顶尖Python知识图谱(关系网络)绘制工具,数据分析的强力助手
这里有15款免费工具推荐:NetworkX(Python基础),Graph-tool(C++速度),Graphviz(可视化库),ipycytoscape(Jupyter集成),ipydagred3,ipySigma(NetworkX + Web),Netwulf(交互式),nxviz(Matplotlib绑定),Py3plex(复杂网络分析),Py4cytoscape(Python+Cytoscape),pydot(Graphviz接口),PyGraphistry(GPU加速),python-igraph,pyvis(交互式图形),SNAP(大规模网络分析)。绘制和理解网络图从未如此简单!
15 0
|
5天前
|
机器学习/深度学习 自然语言处理 数据挖掘
使用Python和大模型进行数据分析和文本生成
Python语言以其简洁和强大的特性,成为了数据科学、机器学习和人工智能开发的首选语言之一。随着大模型(Large Language Models, LLMs)如GPT-4的崛起,我们能够利用这些模型实现诸多复杂任务,从文本生成到智能对话、数据分析等等。在这篇文章中,我将介绍如何用Python连接和使用大模型,并通过示例展示如何在实际项目中应用这些技术。
|
14天前
|
数据采集 数据可视化 数据挖掘
数据挖掘实战:使用Python进行数据分析与可视化
在大数据时代,Python因其强大库支持和易学性成为数据挖掘的首选语言。本文通过一个电商销售数据案例,演示如何使用Python进行数据预处理(如处理缺失值)、分析(如销售额时间趋势)和可视化(如商品类别销售条形图),揭示数据背后的模式。安装`pandas`, `numpy`, `matplotlib`, `seaborn`后,可以按照提供的代码步骤,从读取CSV到数据探索,体验Python在数据分析中的威力。这只是数据科学的入门,更多高级技术等待发掘。【6月更文挑战第14天】
50 11
|
8天前
|
数据采集 机器学习/深度学习 数据可视化
利用Python和Pandas库构建高效的数据分析流程
在数据驱动的时代,数据分析已成为企业决策的关键环节。本文介绍如何利用Python编程语言及其强大的数据分析库Pandas,构建一套高效且可扩展的数据分析流程。与常规的数据分析流程不同,本文不仅涵盖数据加载、清洗、转换等基础步骤,还强调数据可视化、模型探索与评估等高级分析技巧,并通过实际案例展示如何在Python中实现这些步骤,为数据分析师提供一套完整的数据分析解决方案。

热门文章

最新文章