高级数据分析师,必备这7大能力

简介: 经常有小伙伴吐槽:“名曰数据分析师,实际上就是跑数机器,咋样才能进步呀!”额,大家都是从查数姑过来的,莫慌。不过自从我开始带小伙伴独立负责工作以后,越来越感觉到:有些能力是高级数据分析师才要求的,在每天写sql里没得锻炼。具体是哪些?今天简单分享一下。

一、能力VS知识


什么是能力?举个简单的例子:


1、知识(knowledge):统计学讲的回归分析方程 y=ax+b,以及SST、SSR、SSE、R平方等概念是知识。知识是有科学理论基础的,有出处的。


2、技能(Skill):敲出来:from sklearn.learn_model import LinearRegression 是一个技能。技能可以通过操练提高,而且使用技能的时候,你完全不用懂背后的科学原理,会操作就行。


3、能力(Ability):运营部门想预测下下个月的GMV,知道拿几个指标,用回归分析来预测,这是一种能力。能力是在现实工作场景中,因地制宜地使用知识和技能。

 

能力是很重要的!因为现实中工作场景很复杂,比如预测下个月GMV,有好多种方法可以用:时间序列预测、滚动预测、业务模型预测、回归模型预测、拍脑袋……,不同的方法,需要的数据不一样,产生的效果也不一样,因此需要具体思考。

 

并且,做工作不是做学术研究,还得考虑以下跟人有关的复杂情况,因此更得会随机应变见风使舵了。


  • 业务部门能不能理解
  • 领导接不接受结果
  • 领导想手动调整下结果……

 

那么,哪些能力是必备的呢?从完成一个项目的角度,我觉得有这7种能力。

二、七大能力


完成一个数据分析项目,至少有4步:


1、明确目标

2、选择数据

3、进行分析

4、汇报结果

 

为了做好项目,则至少需要7大能力(如下图)


image.png


能力一:理解业务。

 

这是所有工作的基础,想做分析,至少得知道:


1、业务流程是啥

2、业务方会做哪些动作

3、业务方期望的结果是啥


这样后续才有分析目标,才能看数据是否足够多。

 

能力二:梳理需求


这一步经常被新人遗忘,因为大家习惯了等着业务下需求单/发个邮件/打个电话/拍一下肩膀,然后要个数。从而忘记了:我们想做一个完整的分析报告,而不是跑个数呀!

 

想要做一个完整的分析,有清晰的需求是第一位的。“歪,给我个XX数!”不算是清晰的需求,只是个口头要求而已。


清晰的需求,至少得说清楚5w才行:


Who:数据使用者

When:数据使用时间

Where:数据使用场合

Why:使用数据原因

What:具体数据格式

 

特别是Why,直接和分析思路有关,要重点区分业务部门想:


  • 要做监控、找原因、还是做预测?
  • 如是监控,是否业务已上线?什么时候上?
  • 监控数据是否涉及埋点、系统对接?
  • 找原因,是否有假设?假设是什么?
  • 做预测,是否有假设?假设是什么?

 

这样才能避免,辛辛苦苦跑一堆数,被批斗:“没啥用”“我早知道了”的问题。

 

能力三:梳理指标体系

 

指标体系是数据分析的左手。梳理清楚一个项目需要哪些指标,才好继续深入。有些小伙伴很偷懒,总想着找一份“完整的”指标体系,熟读并背会就可以。可实际工作中,业务流程经常有变化,导致很多过程指标需要重新确认,并不是找个模板套就可以的。


image.png



并且,有些过程指标数据采集难度很大,还得考虑怎么和开发谈判,尽可能保障收集。因此梳理指标体系是个重要能力。

 

能力四:梳理标签体系

 

标签体系是数据分析右手。很多时候,业务部门想分析的对象不是指标可以描述的,比如分析“高潜力”,分析“有意向”,分析“刚需型用户”,这些都是通过标签,具象化了一个业务描述。


想要把问题分析清楚,数据分析师就得有能力打标签,有能力把一个业务场景中标签梳理清楚(如下图)。


image.png


注意!业务部门经常有一些内部约定俗成的标签说法,不同部门之间标签口径混乱是常有的事。因此真要做标签梳理,就得有谈判能力,拉各路相关方坐下来慢慢谈。

 

能力五:选择分析方法

 

开篇的例子,就是个选择分析方法的典型例子。比如:


预测类分析:n个模型可以用,用哪个?


原因类分析:从哪个角度切入?如何构建逻辑?


检验类分析:假设是什么?从哪些角度检验?


评估类分析:从哪些角度评估更合理、全面?


这些都是要考虑的问题

 

教科书上虽然有标准的方法, 但怎么结合实际,特别是怎么让业务部门配合过程,接受结果,则是个大学问。经常有一些复杂的方法,被业务部门斥责“看不懂!”“莫名其妙!”而遭受非议,所以选择分析方法,是一个重要能力。

 

能力六:设计数据实验

 

有些问题是没有历史数据可参考的,只能通过实验得到结果。而工作中的实验,又不像实验室里,可以把消费者、店铺、APP扣在玻璃罩子里隔绝外界环境,一点点测试。


因此需要结合业务流程,设计实验方法,考虑这些具体问题:


  • 做抽样实验还是全量实验?
  • 抽样方式、样本量如何设计?
  • 实验次数、实验投入如何控制?
  • 哪些影响因素要提前考虑?
  • 实验对象内部特征要不要管?

 

能力七:输出数据报告

 

很多新人有疑惑:“输出数据报告也是能力?不是有模板吗?”确实,有些公司数据报告有模板,问题是怎么把报告输出给业务,并且获得业务的点赞,真的是一个能力,还是高级能力。因为数据分析结论,会直观反应业务做的好/不好,“屁股决定脑袋”的事多的很!

 

比如:


明明活动不达标,业务非说是“自然增长率”计算不合理


明明指标不达标,业务非说是“大环境不行,不是我没做好”


明明只是小波动,业务非逼着“深入分析0.01%差异背后的深层原因”


怎么办!很难办呀!

 

所以做好汇报,是个很考验综合能力的事。


相关文章
|
2月前
|
数据采集 数据可视化 数据挖掘
数据分析案例-BI工程师招聘岗位信息可视化分析
数据分析案例-BI工程师招聘岗位信息可视化分析
82 0
|
9月前
|
数据采集 数据可视化 数据挖掘
【大数据分析方面的经验和技能】数据可视化、数据报表和预测分析
【大数据分析方面的经验和技能】数据可视化、数据报表和预测分析
|
9月前
|
监控 数据挖掘 数据库
【技能实训】DMS数据挖掘项目(完整程序) 1
【技能实训】DMS数据挖掘项目(完整程序)
93 0
|
9月前
|
存储 数据挖掘 测试技术
【技能实训】DMS数据挖掘项目(完整程序)2
【技能实训】DMS数据挖掘项目(完整程序)
60 0
|
11月前
|
SQL 分布式计算 架构师
如何搭建一个数据分析体系
如何搭建一个数据分析体系
|
数据挖掘
分享五个常用的数据分析方法论,让你的数据分析报告更上一层楼~
如果你在做数据分析的时候,发现自己常常不知道从哪些维度去开展分析或者分析出来的报告总感觉逻辑上不连贯,内容上不完整,那么你一定是缺乏一个合适的数据分析方法论来指导你进行数据分析。
717 0
分享五个常用的数据分析方法论,让你的数据分析报告更上一层楼~
|
人工智能 数据可视化 安全
数据时代不具备数据可视化分析能力,你怎么在工作中脱颖而出?
数据可视化和信息可视化都是可视化的一种方式,数据可视化将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。信息可视化,旨在把数据资料以视觉化的方式表现出。信息可视化是一种将数据与设计结合起来的图片,有利于个人或组织简短有效地向受众传播信息的数据表现形式。
数据时代不具备数据可视化分析能力,你怎么在工作中脱颖而出?
|
机器学习/深度学习 SQL 算法
从开发视角看数据分析
导读:数据分析就是要从杂乱无章的数据中将某个或者某些核心指标做提炼、归纳、总结,找到某个规律,但往往得到的结论不足以支撑下一步的动作,劳心劳力最后无果,又要再继续深挖。本文并不是一篇专业的数据分析方法论,而是从研发角度对自己做的一些数据分析进行思考和总结。
从开发视角看数据分析
初,中,高级的 ABAPer 应该各自具备什么水准的开发能力
初,中,高级的 ABAPer 应该各自具备什么水准的开发能力