没有数据,咋做分析?偷偷给你三大法宝! by彭文华

简介: 没有数据,咋做分析?偷偷给你三大法宝! by彭文华

这是彭文华的第166篇原创

有个朋友私信我,找我抱怨他的苦恼。他花了5位数报了一个数据分析班,分析思路、方法论学了一大堆,结果在公司用不上!原因是因为没有相应的数据!

他一边哭诉无良培训班,一边心疼自己的血汗钱。搞的我这也很尴尬,同理心瞬间爆发,直接代入到培训班老师角色了,各种安慰起来。聊天记录就不发了,太尬了!


不过事后一想,这事情不是这么简单的,我不是给培训班洗地哈,因为这个问题还真值得说一说。


今天是春节最后一天假期了,我这春节不打烊、每天发原创的挑战也算完成了,感谢各位陪着我,支持我。接下来我也得赶紧定下新公司,继续奋斗!欢迎加我个人微信:shirenpengwh,加入数据分析群,咱一起唠唠数据分析那点事。


从斗地主说起

也是,都说数据分析师能开启上帝视角,统揽全局,然后进行科学决策,最大程度的提升企业竞争力。

但是哥们说了,没数据你说个毛线啊!没数据,这上帝视角仿佛也被乌云给遮住了,只看个只言片语,咋分析啊!


不过,谁说不能掌握全局信息就不能科学决策了?


各位过年斗地主赢钱了吗?

我整个假期都在赶稿,可没功夫玩斗地主。但是不妨碍咱拿斗地主说事儿。你是不是觉得有些搞笑,斗地主跟数据分析、科学决策有啥关系啊?

这关系可大了去了!可以说斗地主就是一个非常经典的数据分析应用场景啊!

你看:每个人抓牌之后,只有17张牌,地主20张牌。每个人都并不掌握全局的信息。目标又很清晰,需要三方决战,己方获胜才行。

每个人能看到的信息只有手上的17张+3张底牌。也就是说每个人都是在信息不足的情况下进行决策,期望率先出完手中的牌,获得胜利。

新手打牌呢,基本上就看着手上的牌机械的对应出牌,能管上就管,管不上就过。

老手打牌呢,就会拓展所有信息来源,扩充自己的信息资源。仅凭已知的牌就能推断出非常多的信息。比如,手上17张牌,起码能判断出自己的断张牌,这些都能识别为风险;根据手上的王、2、A、K的张数,能推断出大牌的大致牌力分布;根据手上的3带、4炸的分布,可以确定其他二位的断张情况,从而推断其他人的牌型。比如你手上有3张或者4张7,再根据自己手上的牌,那基本上可以确定上下手的小牌大概率会比较零散。

除了这些之外,老手还会看地主、农民的位置,3张底牌也是很重要的信息。到现在,才是观察自己的牌型分布,找到牌权,确定控场策略,规划出牌战术。

这还不算完!因为以上这些,都是刚拿到牌的时候可以了解的信息。在上下家不断出牌的时候,老手会不断的收集新的信息,帮助他不断确定上下家手中的牌。甚至还会主动出手试探。比如你是地主,手上有1个2,就可以先出一个A试探2的具体分布。出2管你的大概率也是一个2,另外一方基本上就是一对2了;如果有人直接出小王管,那基本上可以肯定外面3个2在一起了。这时候如果手中有大的3带,就得找机会出,消耗掉对方的3个2。这样我们其他稍微小一些的牌就能拿到牌权了。

你可能会说,这不够精准啊,会猜错的。万一就是有人有2就是不管咋办?咱推测的前提是大家都是正常人哈,捣乱的不算,但是更不怕了。我看过不少精彩牌局,有经典牌局霸气到直接判定逃跑的一方手中只剩对4,炸完对方打牌后,打对4挑衅对方的场面。他们判定的真的非常精准。

当然,超强的记牌能力也是必不可少的。2020经典牌局第一名,打到最后,三个人手上只有一张2,其他全是7以下的小牌。就这还惊心动魄的来了三四个来回,最后拿2的稳若泰山,巍然不动,坚决不出2,逼地主出对3,放队友对4赢得比赛。


数据生崽术

所以,没数据咋办?咱学斗地主啊!你看,斗地主也是缺乏数据对吧?我们是怎么做的?

1、充分读懂手上的牌。怎么读?区分牌权、大牌、7/10等关键牌、断张。

2、结合角色、位置、手牌和底牌,推测其他角色手牌牌型分布;

3、结合自己的牌型、牌权、单张、角色和位置,规划出牌战术,如果是农民,需要确定主跑还是配合。

4、在后续出牌的时候,一方面要记关键牌,另一方面可以不断推测其他双方手中剩余的牌力牌型,然后针对性的进行拦截、攻击、引诱和试探。

咱把这些抽象一下,然后应用到数据分析领域上:

1、充分读懂已有数据。怎么读?给现有数据打标签,让数据生个崽儿;

2、结合市场动态、业务场景、参与方等信息,推测其他参与方信息,作出粗略判断;

3、结合自己已有的信息,规划运营策略;

4、布置运营策略监测指标,不断观察其他参与方(如客户)的反应,推测其根因,然后针对性的进行运营策略调整。


比如最简单的一个场景,咱拿到了一个这样的数据,数据量有几十万:

乍一看,信息量太小了,啥也没有。根本啥也代表不了么。我先给你一个法宝:数据生崽儿术。咱先给让数据生个崽儿。咋生?


打标签

所有的日期可以打标签吧?月末、月尾、工作日、星期、周末、节假日,这些都是常规的,弄个日期维全都有了。

所有的时点也可以打标签吧?出行的:早高峰、晚高峰;吃饭的:午饭、晚饭、夜宵高峰;人群活动的:上午、中午、下午、夜晚、深夜、凌晨等等。

所有的地区也可以打标签的吧?一二三四线城市、旅游、文化等等。

订单数也是可以分级分类的吧?小单量、中等单量、大单量、爆单等等。

其他参考数据

打标签这件事情咱可以想很多很多。但是这还不够!咱还可以找到一些引子,引出更多可以参考的数据。

比如我们有时间,是不是可以引出去年同期的数据?

去年的数据没有啊?那我们还有城市,可以引出城市相关的其他数据,常住人口、人均收入、GDP等数据。同时,我们还能引出该城市的行业数据。如果咱分析的是餐饮数据,那就可以看看商圈、餐饮分布、平均消费能力、口味偏好等数据;如果咱分析的是出行数据,那就可以看看职住情况、平均拥堵、平均路程消耗、私有车保有量、天气情况等等数据。

这些都是公开数据,也不需要你花多少时间,都能拿到手。

业务数据

咱除了这一张表格之外,是不是还能获取更多的相关的数据?一方面可以横向拓展,这是业务表现,是最终结果。往前是业务运营,各种活动的数据,再往前是客户运营等等。单从业务表现往下深挖,订单的前后环节(访问、加购、下单、付款、退款等),订单的构成(产品类目、客单价、渠道等)。

啥?你说没权限拿到业务数据?行。没问题,咱还有招!


业务反推术

数据现在变多了吧?啥?你说好像还是没啥分析思路?这里我得多问你一句,什么叫分析思路?是分析套路?分析模型?我认为都太片面了。我理解的分析思路是用数据抽象、整理出真实业务场景的路径。你看AARRR、客户生命周期、杜邦分析法、OSM模型等。

所以想要分析思路,咱得逆向从数据中反推出真实业务场景。当然,但从数据上并不能完全推断出来,所以我们还得用另外一个法宝:业务反推术。

我们从数据上能反推出一些,但是现有数据不够啊。所以我们还得继续获取信息。获取这些信息最好的方式就是找业务人员聊。

哥们说了:我这是在面试啊,没办法访谈业务人员咋办?放心,面试本质上就是一个沟通、谈判的过程。不是高考答题,不让你问问题。没有业务人员,你可问面试官。


KPI分析法

问那些呢?一个取巧的方案:KPI。KPI有非常多的好处,一方面体现了公司的发现方向,另一方面也会告诉你当前业务的核心点。因为没有那个傻子把KPI设置成跟业务没关系的指标上的。而且最关键的是这些KPI之间是有非常重要的关联关系,并且有评判标准!这是非常有价值的数据。我们不仅可以反推商业模型,甚至连业务流程都能梳理出来了!

业务流程分析法

当然如果是在面试,问KPI就没啥用了。我们可以直接问背景、业务目的、业务流程和其他业务特征。

然后再结合数据,就能反推出完整的商业模型、业务框架、业务逻辑了。


分析模型构造大法

可能你还是会说:我现在非常理解公司的业务,但还是没有分析思路啊。更不用说上面那个例子中的那些数据了。

怎么说呢?你说在第一个数据分析模型/思路出来之前,这世界上是咋编出来数据分析模型/思路的呢?

这不是废话呢么?当然是人想出来的啊!

对啊,你我都是人,我们怎么不能想出来思路呢?分析模型/思路越通用,在使用的时候就越不得劲啊!来,我来给你第三个法宝:分析模型构造大法!


代入业务流程

一些数据摆在具体的业务场景中,这含义就会非常清楚。所以有一大类数据分析思路其实就是业务流程式分析。AARRR、生命周期等都是。

横向对比

如果还想进一步分析,那就做横对比,时间层面同比、环比,看增长;地区层面同级别对比、区域性对比,看差异。其他维度同理。

纵向深入

按照MECE的原则,一步步纵向拆分指标数据。其实杜邦分析法、构成、下钻等分析方都是纵向深入的好工具。

业务重构

根据我们对业务的理解,进行解构、重组,最后抽象出来,就有了各种业务分析套路,比如人货场、三流、OSM等等。只要业务理解深,抽象手段熟练,模型思路要多少有多少。


总结

完美的上帝视角是不存在的。因此数据分析永远是在缺少信息的情况下不断逼近真实情况,做出精准决策的过程。

斗地主其实就是一个非常典型的数据分析应用场景,同样没有完美的上帝视角,同样缺少信息,但是又得做出精准的判断。新手打牌只会看手中的牌,老手不但会分析手牌,还会看位置、角色,从而规划自己的战术,还会不断被动、主动收集各种信息,进行准确判断,不断修正出牌策略,最终获得胜利。


我们做数据分析也是一样一样的,用“数据生崽儿术”拓展更多数据,可以用打标签、获取参考数据和业务数据等方法;

再用“业务反推术”不断逼近真实业务场景,可以使用KPI分析法、业务流程分析法等方法;

最后用“分析模型构造法”建立分析思路,提炼对应策略,有代入业务流程、横向对比、纵向深入、业务重构等具体手段。

相关文章
|
8月前
|
BI
数据敏感度是个什么鬼? by彭文华
数据敏感度是个什么鬼? by彭文华
|
2月前
|
大数据 区块链
数据人的“西湖论剑”来了!第一届“数据同学会”在杭成功召开
数据人的“西湖论剑”来了!第一届“数据同学会”在杭成功召开
|
8月前
|
算法 数据挖掘 大数据
到底什么才是数据分析思维? by彭文华
到底什么才是数据分析思维? by彭文华
|
6月前
|
算法
C国演义 [第四章]
C国演义 [第四章]
|
8月前
|
存储 SQL 监控
怎么给大爷讲清楚“什么是大数据”?彭文华
怎么给大爷讲清楚“什么是大数据”?彭文华
|
8月前
|
数据采集 数据建模 数据管理
主数据又是啥东东?应该怎么建?彭文华
主数据又是啥东东?应该怎么建?彭文华
|
8月前
数字化转型案例失利的3大原因 by 彭文华
数字化转型案例失利的3大原因 by 彭文华
|
8月前
如何借助猎头的力量完成一次完美的跳槽?彭文华
如何借助猎头的力量完成一次完美的跳槽?彭文华
|
8月前
|
数据采集 大数据 数据安全/隐私保护
做数据,不治理,等于做饭不淘米 | 彭文华
做数据,不治理,等于做饭不淘米 | 彭文华
做数据,不治理,等于做饭不淘米 | 彭文华
|
10月前
【C国演义】第一章
一堆数字里面,有且仅有一个数字出现的次数是奇数次,其他的数字出现的次数全为偶数次,求出这个数字(要求时间复杂度O(N))