干货 | 数据可视化中5个常见错误及克服方法

简介:

干货 | 数据可视化中5个常见错误及克服方法

数据可视化的普及和影响在相对较短的时间内急剧增加。 Google趋势显示,自2009年以来,数据可视化的搜索频率几乎增长了100%,我们已经看到了大量可用的工具和软件,几乎任何人都可以相对轻松地创建数据可视化。

比起文本,我们本能地更热衷于图像,因为大脑能够以更快的速度处理图像。 然而,这并不意味着你可以把大量的图像和形状放在仪表板上,并期望你的观众赞叹。 就像在我们被图像吸引背后的认知方面,还有其他固有的东西,在某种程度上,与潜意识的行为变得相关。 其中之一就是第一印象。

我们都知道这句话:第一印象持续一生。 但它背后有多少真理呢? 好吧,事实证明:非常多。 类似于本能战斗或逃跑反应,人类执行无意识思维的行为,称为快速认知; 比我们习惯的刻意的决策风格更直观,更快速。

快速认知是我们从一个非常短暂的经验中深入挖掘和衡量真正重要的能力。 正如我们被告知从来不要通过一本书的封面判断它一样,我们每天都使用这种能力,它通过快速解析大量的信息,决定什么是最重要的,而不采取较慢,更理性的思维方式。

心理学家称这种现象为“薄片(thin-slicing)”:在几秒钟内感知细节或信息需要大脑的理性部分花费几个月或几年的时间去评估。 Malcolm Gladwell将其描述如下:

薄片(Thin-slicing)不是一种异国情调的礼物。 它是对于人类来说意味什么的中心部分。 每当我们遇到一个新的人,或者必须快速地了解一些东西时就会发生薄片现象… …我们依靠这种能力,因为在很多情况下,仔细注意细节,即使不超过一秒钟,都可以告诉我们非常多的信息。

好消息是,你可以改变和反驳别人对你不良的第一印象,让他们更了解你。但是在网络上这就要困难得多,因为我们的注意力周期总是在历史新低处。与之对应的,比以往任何时候都更难吸引你读者的注意力,你不能让坏的第一印象进入你数据可视化的个人简介里——尤其是当信息被埋藏的更深时容易引人探究。

为了防止这一点,我们将讨论5个最常见的错误,以避免涉及不同可视化类型数据的错误形式。

1.数据过载

许多可视化数据和BI仪表盘的牺牲品数据过载——内容拥挤,其中一些可能不添加任何数据的理解。例如,尽管三维图表看起来可能令人印象深刻,但他们往往使数据的解释更加困难。

同样的,BI仪表盘与5图表和众多的标签可能会展示数量显著的研究结果,但如果你的读者无法区分他们在看什么,最终也是无用的。不必要的插图、阴影、字体和纹饰会使数据分散,所以尽量少用。在大多数情况下,少即是多。

2.访问轴

处理定量数据时,条形图或折线图是使内容可视化最好的方法之一。一个常见的错误是图表轴;当它看上去是有效启动轴值越高于零时值越大,这可以将酒吧营业额和他们价值观精确的表示。

3.不要“切太薄”

处理全部数据时,数据通常以部分到整体关系的形式出现,更为人知的是叫做饼图。 饼图是一种非常受欢迎的表现数据的方法,然而饱受非议的是,正如Walter Hickey所说,它是“他们表面上被设计用来做的令人难以置信的糟糕的一件事”。

没有区段标签,实际上很难区分饼状图段的大小(你能区分36%和37%之间的差异吗?),因此确保图表的所有区域都清楚地标记。 此外值得考虑的是所使用的类别的数量; 太多不同的段使得每个段之间难以区分。

4.交叉线

位于特定范围内的数据通常用于展示随时间的变化。 因此,折线图是传达数据之间的变化或差异的有效方式。 您可能已经开始注意到这里的趋势,但重要的是不要在图表中使用太多的线。 在图表上有大量的交换线会很快变得混乱,因此我们建议不要使用超过4个系列。

5.适当的颜色

热图是数据可视化世界中最新的图表之一,并迅速变得流行。 使用地理空间作为基础是完美的分类数据,但有一些障碍可能会使你迷惑。 颜色和数据范围都应在热图中正确使用。

一些颜色比其他颜色更突出,这可能给数据带来不必要的权重。 相反,使用具有不同阴影的单一颜色来显示强度水平。 对于数据本身,请选择3-6个数字范围,在它们之间均匀分布数据。 +/-符号可以扩展高的和低的范围。

通过数据高效地讲故事是一个必需的技能,这将有助于你在组织中的影响力。


本文作者:Josh Anderson

来源:51CTO

相关文章
|
2月前
|
数据可视化 数据挖掘
如何利用数据可视化工具来发现处理后数据中的异常或不一致?
在使用这些可视化工具时,需要仔细观察图形中的细节,结合数据的背景和业务知识,来准确判断是否存在异常或不一致。同时,也可以通过交互操作和深入分析来进一步挖掘潜在的问题。
57 2
|
6月前
|
数据可视化 数据挖掘 数据处理
深度挖掘!Python 数据分析中 Matplotlib 与 Seaborn 的隐藏功能,让数据可视化更出彩!
【7月更文挑战第23天】在Python数据分析中,Matplotlib与Seaborn是关键的可视化工具。Matplotlib提供深度自定义,如调整轴刻度和网格,支持多子图布局。Seaborn基于Matplotlib,简化美观图表生成,内置主题与调色板,适用于复杂统计图形如小提琴图和成对关系图,且无缝集成Pandas数据框。掌握这些库的高级功能,能显著提升数据可视化效果,助力数据分析决策。
54 4
|
8月前
|
数据可视化
8个常见的数据可视化错误以及如何避免它们
本文揭示了8个数据可视化常见错误:误导色彩对比、过多的数据图表、省略基线、误导性标签、错误的可视化方法、不实的因果关系、放大有利数据和滥用3D图形。强调清晰、准确和洞察力的重要性,提醒制作者避免使用过多颜色、一次性展示大量数据、错误图表类型以及展示无关相关性等。正确可视化能有力支持决策,不应牺牲真实性以追求视觉效果。
699 6
|
8月前
|
数据可视化 BI 定位技术
数据可视化系列-02各类图表的综合使用介绍及实践-下篇
数据可视化系列-02各类图表的综合使用介绍及实践-下篇
|
8月前
|
数据采集 数据可视化 前端开发
数据可视化系列-02各类图表的综合使用介绍及实践-上篇
数据可视化系列-02各类图表的综合使用介绍及实践-上篇
|
数据可视化 Cloud Native BI
面试中的数据可视化:如何用数据支持你的观点
面试中的数据可视化:如何用数据支持你的观点
158 0
|
机器学习/深度学习 数据采集 数据可视化
两种方法教你一行代码实现探索性数据分析报告
两种方法教你一行代码实现探索性数据分析报告
两种方法教你一行代码实现探索性数据分析报告
|
机器学习/深度学习 算法 安全
数据分析中常见的"数据陷阱" !!!
数据分析中常见的"数据陷阱" !!!
395 0
数据分析中常见的"数据陷阱" !!!
|
数据可视化 BI
技术人最不该忽视可视化数据分析!
阿里妹导读:在这个“人人都是数据分析师”的时代,阿里的同学几乎都在参与数据的采集、加工与消费。数据可视化作为连接“加工——消费”的重要一环,其质量至关重要。优秀的可视化能促成卓越洞见,糟糕的内容则让所有的努力失去意义。今天,阿里高级产品经理沉砂为我们详细介绍数据可视化工具以及如何选择有效图表。
8892 0