数据分析7大能力:梳理数据需求

简介: 今天分享数据分析师必备的工作能力——需求梳理。需求梳理很不起眼,甚至很多小伙伴感受不到他的存在。但它结结实实影响到大家的下班时间和绩效。


一、什么是数据需求?


顾名思义,数据需求,就是业务部门对数据分析产出的需求。有小伙会说:这还有需求呀,我们公司都是一通电话:“歪!给我个XX数据,快!”就完事了,根本不存在啥需求。


确实有这种无脑公司。不过,这么无脑催数据的结果,就是返工。最常见的局面,就是你辛辛苦苦跑出来数,对面的一通质疑:“数据不对吧!”“为啥和我知道的不一样!”“你再给我个XX数据看看?”“加个字段吧!”然后苦逼的数据分析师,又得重新回去跑数,跑完了又得经历一轮Diss。


所以想早点下班,想不被甩锅,就得梳理清楚:到底业务想要的是什么?


二、怎样是清晰的需求?


一个清晰的需求,需要做到5w清晰。


  • Who:数据使用者
  • When:数据使用时间
  • Where:数据使用场合
  • Why:使用数据原因
  • What:具体数据格式

三、who:谁使用数据


包括:


  • 申请人:部门,姓名


  • 审批人:领导签名、邮件回复


加上审批人,可以在一大堆需求塞车的时候,按领导等级高低排序给数。加上审批人邮件/书面签名,能有效避免每个人都说自己“很急!”“重要!”的尴尬局面。


四、when:什么时间使用


当然,大家都希望我这一刻提数据,下一秒马上有。但是干活总需要时间,而且需求多了总得排队,所以最好提一个普通/加急/特批的时间差异。比如普通需求提前3天,加急提前1天,特批的今天内优先做(当然,需要对应的老板书面批准)。


很多没骨气的数据部门领导,不敢搞分级管理。但这其实是害死自己。因为不分级管理,业务部门的需求就会像决堤的洪水。


一来,既然业务打个电话数据就拼命了,那业务还看BI干啥,那业务还看日报干啥!不看!我就打电话逼着你干。这样已上线的数据产品,使用率惨淡,回头还是被批:“做BI都没用!”


二来,自己每天007加班做需求单,照样做不完,照样被人喷“我就要个数,你还搞那么久!”照样有人因为需求塞车来吵架。


所以苟且偷生,最后就是死路一条。管得了期望时间,才好体现数据分析的业绩。

五、where:在什么场合使用


这里重点关注是:


  • 部门内使用:自己闭门分析
  • 平级部门使用:几个部门开会用
  • 向上汇报使用:总裁办、总公司
  • 对外发布使用:公众、媒体、社会


区分使用场合,主要为管理口径,避免口径混乱引发的争议。减少数据部门背锅。


  • 如涉及不同部门汇报,则重点关注两个部门共同关心的指标。
  • 如是对上汇报,则要核对是否和管理层看的固定报表是否有重叠。
  • 如是对外汇报,则要核对之前公布的数据,避免自己打自己脸


很多公司数据背锅,其实就是没做好这一步。不主动问数据用在哪里,结果业务拿着数据乱捅一波,捅完了就说:“诶呀,我们又不懂,都是数据提供的你去问他”……数据自然百口莫辩,死无全尸……所以不要吝啬语言,问清楚!


六、why:为什么需要数据。


这里和分析思路有关,重点区分:


  • 要做监控、找原因、还是做预测?
  • 如是监控,业务是否已上线?什么时候上?
  • 监控数据是否涉及埋点、系统对接?
  • 找原因,是否有假设?假设是什么?
  • 做预测,是否有假设?假设是什么?


有些业务部门思路清晰,可以讲得很清楚,自然省事。有些部门不想说,或者稀里糊涂说不清,就得引导他们说清楚。


如果没有提前沟通好埋点/数据同步的问题,监控是没法按时上线的,更没法提供准确数据。相当多公司埋点管理混乱,就是因为数据、开发、业务相互不通气,信息不一致造成的。


如果没有提前说清楚假设,很有可能拿到的数据维度不够,指标不全,导致反反复复提数。或者业务部门看了数跟没看一样,照样不利于工作开展。


七、why:为什么需要数据。


这里是具体的需求,要具体到


  • 取数对象:针对XX用户、商品、渠道、产品取数
  • 取数时间段:从X月X日-X月X日
  • 数据指标:取XXX指标。如是数据字典内标准指标,则直接引用名字。如是临时发明的,需说清楚指标的计算公式
  • 分类维度:按XXX维度区分数据。


思路清晰的业务部门,自然不用多说。碰到思路混乱的,可以这么引导


  • 你要分析的是人?货?还是场?(清晰取数对象)


  • 明确一个重点,比如人以后,开始加“的”。你要分析的是,人的XX情况(清晰指标)在XX时间段内的XX情况(清晰时间)


  • 加分类维度。你要不要做个对比?你想不想了解不同区域/时间的差异?你想不想看内部结构(清晰分类维度)


这样三个问题引导完,就很清楚了。


八、小结


满足了5w的,就是一个完整的数据分析需求了。梳理数据分析需求,不但能减少重复工作,更可以为数据分析师发现项目机会,提高BI使用率,体现工作业绩打下坚实的基础。至于具体如何做,下篇再分享。今天就先写到这里啦,喜欢的同学,记得转发+点赞+在看三连支持下小熊妹哦,谢谢大家。

相关文章
|
2月前
|
数据挖掘 PyTorch TensorFlow
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
58 0
某A保险公司的 数据图表和数据分析
|
3月前
|
数据采集 DataWorks 数据挖掘
提升数据分析效率:DataWorks在企业级数据治理中的应用
【8月更文第25天】本文将探讨阿里巴巴云的DataWorks平台如何通过建立统一的数据标准、规范以及实现数据质量监控和元数据管理来提高企业的数据分析效率。我们将通过具体的案例研究和技术实践来展示DataWorks如何简化数据处理流程,减少成本,并加速业务决策。
438 54
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
49 0
|
2月前
|
机器学习/深度学习 数据挖掘 TensorFlow
🔍揭秘Python数据分析奥秘,TensorFlow助力解锁数据背后的亿万商机
【9月更文挑战第11天】在信息爆炸的时代,数据如沉睡的宝藏,等待发掘。Python以简洁的语法和丰富的库生态成为数据分析的首选,而TensorFlow则为深度学习赋能,助你洞察数据核心,解锁商机。通过Pandas库,我们可以轻松处理结构化数据,进行统计分析和可视化;TensorFlow则能构建复杂的神经网络模型,捕捉非线性关系,提升预测准确性。两者的结合,让你在商业竞争中脱颖而出,把握市场脉搏,释放数据的无限价值。以下是使用Pandas进行简单数据分析的示例:
43 5
|
3月前
|
存储 数据挖掘 数据处理
DataFrame探索之旅:如何一眼洞察数据本质,提升你的数据分析能力?
【8月更文挑战第22天】本文通过电商用户订单数据的案例,展示了如何使用Python的pandas库查看DataFrame信息。首先导入数据并使用`head()`, `columns`, `shape`, `describe()`, 和 `dtypes` 方法来快速概览数据的基本特征。接着,通过对数据进行分组操作计算每位顾客的平均订单金额,以此展示初步数据分析的过程。掌握这些技能对于高效的数据分析至关重要。
41 2
|
3月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
92 2
|
2月前
|
机器学习/深度学习 数据挖掘 TensorFlow
从数据小白到AI专家:Python数据分析与TensorFlow/PyTorch深度学习的蜕变之路
【9月更文挑战第10天】从数据新手成长为AI专家,需先掌握Python基础语法,并学会使用NumPy和Pandas进行数据分析。接着,通过Matplotlib和Seaborn实现数据可视化,最后利用TensorFlow或PyTorch探索深度学习。这一过程涉及从数据清洗、可视化到构建神经网络的多个步骤,每一步都需不断实践与学习。借助Python的强大功能及各类库的支持,你能逐步解锁数据的深层价值。
65 0
|
3月前
|
数据采集 数据可视化 算法
GitHub星标68K!Python数据分析入门手册带你从数据获取到可视化
Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python 无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用 Python 便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。
|
3月前
|
供应链 数据可视化 数据挖掘
【python】python省市水资源数据分析可视化(源码+数据)【独一无二】
【python】python省市水资源数据分析可视化(源码+数据)【独一无二】