数据敏感度是个什么鬼? by彭文华

简介: 数据敏感度是个什么鬼? by彭文华

这是彭文华的第154篇原创

不少招聘数据分析师的JD里都注明“数据敏感度强”。好多朋友都很无奈,这个敏感度我都不知道怎么量化,更不知道怎么提升。用时兴的话来说,就是找不到“抓手”。

你这个数据敏感度强究竟是个什么意思?



啥是数据敏感?

我专门问过很多招聘数据分析师的面试官,说啥的都有,什么数据经验丰富、看一眼就知道啥情况、能快速从数据中找到异常等等。还有些人更神,说数据敏感度强就是能透过数据看到问题本质。这个描述怎么说呢?有点算命先生的感觉。


从我自身情况来说,我在数据这行十几年了,数据敏感度应该是有了吧?在我非常熟悉的环境,数据看的非常多了,上面说的什么看一眼就知道啥情况、快速从数据中找到异常、甚至看到某个数据就大概能知道原因等,都能做到。


这种情况我在一个客户身上也看到过。那还是十多年前,刚入职场的时候,给政府做项目呢。某省经信局中小企业管理处(我记得非常清楚)处长就是这样。他在这个处待了小二十年,各市的重点企业名单都刻在脑子里了。每天的工作就是报表、行业、企业,轮番着来。他时刻关注市场价格波动,因为价格一波动,上下游的企业就会找协会,协会就会找他。


不过,虽然我有时候能这样,但是这种情况时灵时不灵的,跟段誉的一阳指有点像。

在我持续研究分析的时候,是慢慢会灵验的。在我换一个业务场景,或者脱离当时的业务一段时间之后,就不灵了。所以有阵子我就在想,这个敏感度应该不是一个普适性的东西。


我一直认为是我的经验还不够。直到有一天,看到万用表的时候,我突然就悟了!数据敏感度不是靠经验,而是靠标准!


灵敏的万用表

万用表长这个样子,是用来测电压、电流、电阻啥的。

上面是指针,下面可以调节档位。就是这个档位让我悟到了数据敏感度究竟是个什么鬼。

我用一句话给你解释什么是敏感度:

万用表通过档位控制和调节上面表盘指针的敏感度,换句话说,表盘上指针的敏感度是通过档位进行调节的。那我们数据分析师的敏感度是什么决定的呢?历史数据和各种参考标准。


好像有点绕,没关系,我举个例子。今天你媳妇回来说:今天鸡蛋5.5元一斤。如果你压根就没买过菜,你大概率没啥感觉。现在谁口袋里还掏不出5块钱啊,对吧?

你媳妇又说:半个月前都6.8元一斤!你可能有点高兴,这不是降价了么?多好啊!

你媳妇又说:俩月前才3块多一斤。你可能又有点奇怪,鸡蛋价格最近怎么胡乱卖啊?

你看,5.5元,你没啥感觉。加一个6.8的高标准,你就觉得5.5还挺便宜的。再加一个3块多,顿时感觉太贵了有没有?


很多时候你在一个业务里深挖之后,各种历史数据、业务细节、数据分布都熟悉了,各个政策也了解的非常深,非常透,这种数据敏感度自然也就有了。

这不是你的经验使然,而是标准使然。所以有些老板比数据分析师对数据更敏感,不是他们在数据领域更有经验,而是他们对业务、价格、市场更加关注,标准更立体、丰富导致的。


如何锻炼数据敏感度?

既然数据敏感的来源已经清楚了,那么锻炼自己数据敏感度的方法也就可以推导出来了。而且,你自己也可以整理一个自己的数据敏感度锻炼方法。

既然标准决定敏感度,那么我们锻炼数据敏感度的第一个方法就是设定合理的标准。比如“炉火纯青”这个标准,就是用火焰的颜色区分有炉火有多烫。

但是有些时候一个火焰,上下颜色都不一样,这就不好判断了。而且,用颜色区分还有一个不好的地方,就是区分度不够强。还有,这个纯青是个什么颜色?字面上也理解不了啊。但是还好,我们现在有更精确的方式:温度,这个温度就非常精准了。所以,咱得进一步:需要有一个精确量化的标准。

这样够吗?还不够,因为你还缺少参照物。有了这个参照物,你就能直接下结论了。比如你如果有了这个量表,你也能对温度非常敏感了。

如果我们再加上几个生活中的参照,那就无比鲜活了。比如:

蜡烛40℃就会软化变形;

水烧开了是100℃;

把铅烧融化,只需要327℃;

融化铜或者金子则需要1100℃;

把沙子(硅)烧化则需要1400℃。

把铁烧化就更难了,要1535℃。


我们在平时的工作中,量化标准=指标,参照物=历史业务表现和KPI。而且,参照物越多,你就能感知更多的东西。

当这些都深深的刻在脑子里之后,我们也就能通过细微的数据变化,感知到业务的各种异常情况了。


就像之前举的卖鸡蛋的例子。锻炼你对鸡蛋价格敏感度的方法有以下几步:

1、你每天都去买鸡蛋,持续感受鸡蛋价格波动,这个体感最强,但是非常耗时;

2、看鸡蛋价格监测数据,这个能快速感知,但是体感差一点意思;

3、看物价监测数据,这样还能横向对比肉、蛋、奶、白菜的情况,纵向分析整鸡、鸡肉、饲料等上下产业链的价格情况。

4、看兜里的钱,这样你还能知道自己消费能力,盘算一下是不是可以奢侈一把,吃一个茶叶蛋了。


总结

数据敏感度听上去很虚,让人一头雾水。但是扒开这玄之又玄的外衣,数据敏感度其实就是量化标准+参照体系。

用炉火纯青判别火炉内的温度就是非常典型的标准,但是用温度量化会更精准,加上一系列的对比、参照会更加丰富和完善了。比如颜色与温度的对照、生活中的温度对照等等。

我们想要锻炼数据敏感度,其实也就上面这些招术:跟紧业务、制定指标、完善指标体系、参照历史、参照行业、参照KPI等等。

相关文章
|
18天前
|
算法 数据可视化 数据挖掘
JCR一区10.9分|单细胞:有一手数据的肿瘤课题组怎么冲高分文章
这篇文章介绍了在《肿瘤免疫疗法》杂志上发表的一项研究,该研究利用单细胞RNA测序技术揭示了肝细胞癌(HCC)中FABP1(脂肪酸结合蛋白1)依赖的免疫抑制环境。研究分析了II期和III期HCC患者样本的免疫细胞,发现FABP1在III期HCC的肿瘤相关巨噬细胞(TAMs)中过度表达,并与免疫抑制有关。FABP1与PPARG(过氧化物酶体增殖物激活受体伽玛)相互作用,促进了HCC中的脂肪酸氧化,进而影响免疫应答。
28 0
|
11月前
|
编解码 自然语言处理 算法
利用 PRIMO 重构 M87 黑洞图像,普林斯顿高等研究院成功将「甜甜圈」变身「金戒指」
利用 PRIMO 重构 M87 黑洞图像,普林斯顿高等研究院成功将「甜甜圈」变身「金戒指」
103 0
2021年度训练联盟热身训练赛第一场——Weird Flecks, But OK(最小圆覆盖)
2021年度训练联盟热身训练赛第一场——Weird Flecks, But OK(最小圆覆盖)
60 0
2021年度训练联盟热身训练赛第三场——C,G,I
2021年度训练联盟热身训练赛第三场——C,G,I
65 0
|
数据采集 人工智能 分布式计算
岁末忆今朝,辞旧话新潮——心灵与技术的聚合
岁末忆今朝,辞旧话新潮——心灵与技术的聚合
95 0
岁末忆今朝,辞旧话新潮——心灵与技术的聚合
Nature封面:可控核聚变里程碑式新进展,燃烧等离子体实现
Nature封面:可控核聚变里程碑式新进展,燃烧等离子体实现
216 0
Nature封面:可控核聚变里程碑式新进展,燃烧等离子体实现
|
量子技术
挑战唯物论?诺奖得主彭罗斯:意识产生可能是大脑内的「量子叠加」的结果
量子物理学取得了巨大成功,但其解释仍然不确定。大脑由神经元组成,而神经元又由分子组成,很可能会受到量子效应的影响。量子力学和神经科学能否融合成「量子意识」理论?
249 0
挑战唯物论?诺奖得主彭罗斯:意识产生可能是大脑内的「量子叠加」的结果
|
存储 机器人
科技可以让葡萄酒更好喝?细数业内葡萄酒科技
科技可以让葡萄酒更好喝?细数业内葡萄酒科技
131 0
科技可以让葡萄酒更好喝?细数业内葡萄酒科技
|
安全 数据挖掘 C++
迄今最大规模新冠肺炎临床数据:男性病死率是女性3倍多,一人可传染3.77人
迄今最大规模新冠肺炎临床数据:男性病死率是女性3倍多,一人可传染3.77人
249 0
迄今最大规模新冠肺炎临床数据:男性病死率是女性3倍多,一人可传染3.77人