前天,小熊妹的同事发过来一张图,问:“小熊小熊,你能从这个图里看出啥问题吗?”(如下图)
小熊妹当时就震惊了!从这张图,我们可以直观、清晰、明确的看出:“这位同学,你不会做数据图呀!”两个人比身高,不应该背靠背吗,为啥要叠罗汉呢……
那正确的图该咋画呢?今天小熊妹认真科普一下哦。做数据图只是个通俗说法,行业习惯叫:数据可视化。数据可视化,可以做出很多炫酷的图表,但也不是乱做的,需要遵循一些基本规范。
什么时候该做可视化
当数据描述很简单的时候,是不需要做可视化的。比如:小熊妹12月份全月个人消费了10000元。这时候只有1个对象,1个指标,1个时间,也没有细分这10000元到底都花到哪里去了,这就属于典型的简单数据,这时候不用做可视化,直接展示出来就好了,多清晰(如下图)
如果需要描述的数据变得复杂,就可以用图表的形式,让数据变得更容易看,更容易理解。评价数据是否复杂的,是对象,指标,时间,细分四个方面。下边来一个个看看吧~
简单的数据可视化
其他条件不变,当对象从1个变成N个,这时候可以用条形图来展示。比如大家看到小熊妹一个月花了10000大洋!就会想:“哇塞,小熊妹是不是个败家娘妹呢?”这个只有1个人肯定看不出高低,是勤俭持家还是败家,得和其他妹纸比一比(如下图)。
条形图很适合做多个对象之间的比较。因为这种从上到下的陈列方式,很符合人们心中“皇榜”“赛马图”的格局,因此一看过去便知道高低,比直接陈列数字看的清楚。这就是数据可视化的第一个优势:清晰。
只是,只是这么一对比,就显得小熊妹真的很败家了!才不是呢,哼!
其他条件不变,要考虑一个指标的内部结构,这时候可以用饼图。比如光看小熊妹月消费1万,看起来很败家,可到底花到哪里了呢?如果在北上深这种高消费城市,日常生活都不止1万吧。所以得看看这一万块的构成,这就是内部结构了(如下图)
饼图很适合看内部结构组成。因为切大饼的方法,很直观,能一眼看到占大头的是哪里。这就是数据可视化的第二个优势:直观。
只是,只是这么一对比,小熊妹的败家似乎更加实锤了!居然有那么大比例网购!肯定在12月剁手剁了不少,熊爪子估计都剁没了!
其他条件不变,要考虑一个指标的时间变化,这时候可以用条形图。比如想知道小熊妹是一直这么败家,还是偶尔剁剁手,光看一个月数据不行,还得多几个月,这时候可以如下图:
诶?这么一看,似乎为小熊妹洗白了一点:人家只是双十一,双十二的时候才败家吗,平时吃土吃的可积极了!这就是数据可视化的第三个优势:发现规律。数据走势本身,能反应很多问题。
如果把时间再放长一点,条条数量更多,可能看不清楚,这时候可以用折线图,比如看小熊妹过往2年的数据,这样至少有24个数,用折线图看的更清楚(如下图)
时间拉长,看趋势会更清楚。这么看的话,小熊妹就被洗的更白了:人家只是618,双十一,双十二,过年的时候花的多吗!平时是个积极的吃土小能手。
其他条件不变,要考虑多个指标的内部结构,这时候可以用雷达图。
但要注意,如果不同指标单位不一样,直接做雷达图会显得很奇怪,比如收入的单位是元,身高单位是厘米,颜值只能内心打分。这时候可以对每个指标,单独做评分或者做标准化处理,处理成统一的评分或者指数,再做雷达图。
复杂的数据可视化
如果用数据描述复杂的问题,对象,指标,时间,细分四个方面,就有两个方面及以上发生变化,做图就会复杂。
比如,我们不单单想知道小熊妹过去1年内每个月的消费,每个月的逛街次数,这两个孤立的数据。我们还想知道:是不是逛街越多,花钱就越多。这时候我们想发现的,是数据之间的相关关系,就可以做散点图(如下图所示)
散点图虽然不能严格论证相关关系,但是可以很直接的反应出来,如果散点图真的分布很散,就说明两个指标之间没啥关系,如果散点图出现一定的规律性,则表明有深入分析的机会点。这是数据可视化的第四个好处:方便。做个图可比做各种模型,算各种检验值方便多了。
如果想观察一个指标在不同时间的结构变化,可以用堆积图(如下图)
堆积图在分析问题的时候,非常有用!比如从上图,能直接看出来,小熊妹消费额变化,主要是网购份额变化导致的,真是网购小能手!
同样的,如果想对比两个对象的结构变化,也用堆积图比较合适。相比饼图,堆积图在反应不同个体的差异的时候,看的更清楚。比如下图,是不是一眼能看出来,萱萱是个吃货呢。
如果想对比N个对象在不同时间的指标变化,可以用折线图。这种对比会衍生出一种方法:趋势分析法,后续有机会再分享哦。如下图所示:
如果想对比N个对象在N个指标的差异,可以用雷达图。如下图所示:
小结来了
反映内部结构:饼图、堆积图
反映时间变化的:柱状图、折线图
反映排名顺序的:条形图
反映相关关系的:散点图
反映多个指标的:雷达图