8个常见的数据可视化错误以及如何避免它们

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 本文揭示了8个数据可视化常见错误:误导色彩对比、过多的数据图表、省略基线、误导性标签、错误的可视化方法、不实的因果关系、放大有利数据和滥用3D图形。强调清晰、准确和洞察力的重要性,提醒制作者避免使用过多颜色、一次性展示大量数据、错误图表类型以及展示无关相关性等。正确可视化能有力支持决策,不应牺牲真实性以追求视觉效果。

在当今以数据驱动为主导的世界里,清晰且具有洞察力的数据可视化至关重要。然而,在创建数据可视化时很容易犯错误,这可能导致对数据的错误解读。本文将探讨一些常见的糟糕数据可视化示例,并提供如何避免这些错误的建议。

本文总结了8个数据可视化的典型错误,在日常工作中我们应该尽量避免,这样才可以制作出更好的可视化效果。

1、误导色彩对比

虽然使用不同的颜色有助于解释数据可视化,但过多的颜色会让用户感到困惑。坚持使用有限数量的独特颜色是至关重要的。

用户不知道那个值更重要,并且当可视化中有太多的颜色时,用户可能需要更长的时间来理解信息。

不要使用颜色来显示哪个值比其他值高或低。具有高对比度的颜色使观看者感知到更多的数据价值。确定对比度值的最简单方法是在灰度上比较对比度颜色,而不是使用不同的颜色。

2、太的数据图表

使用大量数据提供更有深度的内容并没有什么错,但如果一次性呈现太多数据,可能会让用户不知所措。

用户无法理解所有的可视化细节,并且不知道该把注意力集中在哪里。

所以首先要确定用户需要关注什么,这样就可以将数据限制为与想要传达的信息最相关的数据。并且不要把所有的见解都写在图表里。多种可视化可以帮助您更有效地交流数据。

建议在单个可视化中使用不超过5-6种颜色。

3、省略基线而只显示比例

这种数据可视化问题在汇报时很普遍,它可能会显示错误的模式,甚至是不存在的趋势。

听众没有完全理解这些数据,在某些情况下会导致误解。当然也可以故意这么做,你懂的

4、误导性标签文字

在数据可视化中,不仅图表本身可以表达含义,标题、标签、符号和描述也帮助用户理解信息。如果这些更改呈现的故事与数据有所不同,则用户可能会感到困惑。

上面这张图表描绘了遭受骨科损伤的儿童的百分比。如果用户只看标题而不看描述,他们可能会认为5.2%的正常儿童患有脊髓损伤,从而产生严重的误解。

即使数据是正确的,如果文本修改具有误导性,也可能影响受众的解释。

只有在需要说明所展示的内容时,才应使用书面描述。并且要确保标题、标签和描述传达的意思没有误导性。

5、错误的可视化方法

选择适当的可视化来表示数据是数据可视化的关键步骤。可能有几个图表适合显示数据,但是如何选择最好的一个呢?

在上图中,两个图表都可以显示每个候选人的回答百分比。但是当我们用饼状图表示它时,用户可能会感到困惑,因为图表部分看起来彼此相似,并且数字不能等于100%。

所以需要为数据选择合适的图表,必须首先确定数据试图传达什么样的见解。一旦有了这些信息可以按照下面的方法来选择使用那个图表



6、没有因果关系的相关性

你有没有遇到过数据显示出相似的趋势,但是原因却有很大的不同?如果你把他们放到一起,可能导致用户试图找出与彼此无关的事情的原因。

如图所示,自杀人数的上升与美国在科学、太空和技术方面的投资数额的上升是同步的,这似乎是相同的趋势。然而,如果我们在科学上投入更多的钱,我们真的会看到更多的案件的增加吗?

这种相关性是误导性的,因为它没有联系。所以在制作图标前一定要确认趋势相同的数据是否有相关性。

7、放大有利数据

这是一种选择性地展示支持你观点的数据,同时忽略与你观点相反的证据的方法。在可视化中只会显示一点点来自实际数据的见解。

这种可视化隐藏了重要的数据,只给我们的用户一点洞察力。

如果你是要做正经的报告一定要注意这一点,但是哪些不正经的汇报这个方法十分有用,你懂的。

8、3D图形使用不当

大多数3D图表不再经常用于显示常见数据,因为它们有很大的数据失真风险,因为我们的人眼很难理解3D视觉效果。

但是有好多人却在一直使用,这是因为他的视觉表现比较酷炫。

这个饼状图让后半部分看起来比前半部分大,尽管实际值是30%比35%。另一种类型的3D图表在准确显示数据值方面存在一些问题。

3D图表会扭曲数据的真实性。所以尽量使用2D图表。当然如果某人偏爱酷炫的效果,那么就用吧,没办法。

并非所有数据都需要在可视化中表示

你的数据有时可能会为自己说话。有些值可以表示重要的信息,可能不需要在数据可视化中显示这些信息。

在图表或图形中显示数据可能是不必要的。数据可视化是一种传递信息的手段。在某些情况下可以使用它,而在其他情况下使用其他工具更合适。

总结

掌握数据可视化意味着将复杂的数据转化为令人信服的、真实的叙述。我们优先考虑每个图表的清晰度、准确性和洞察力,确保这些数据和图表可以为我们的决策提供准确的支持。正确的可视化不仅讲述了一个故事,而且还赋予了决策权力。

https://avoid.overfit.cn/post/074ed8e7d37c483083c7143526d65ffa

目录
相关文章
|
6月前
|
存储 机器学习/深度学习 数据采集
数据分析师如何处理数据以进行分析?
【4月更文挑战第4天】数据分析师如何处理数据以进行分析?
55 9
|
6月前
|
数据处理 索引 Python
Pandas常见问题与解决方案:避开数据处理中的坑
【4月更文挑战第16天】本文总结了Pandas数据处理中的常见问题及解决方案:1) 数据类型不匹配,使用`astype`转换;2) 缺失值处理,用`dropna`删除或`fillna`填充;3) 内存占用过大,通过选择性加载列、指定`dtype`和使用`chunksize`分块处理;4) 合并数据问题,确保键匹配和正确合并方式;5) 排序和分组聚合错误,使用`sort_values`/`sort_index`和`groupby`配合聚合函数。掌握这些技巧可提高数据处理效率。
|
机器学习/深度学习 算法 安全
数据分析中常见的"数据陷阱" !!!
数据分析中常见的"数据陷阱" !!!
381 0
数据分析中常见的"数据陷阱" !!!
|
SQL 自然语言处理 数据可视化
python数据分析和可视化——一篇文章足以(未完成)-2
python数据分析和可视化——一篇文章足以(未完成)
211 0
python数据分析和可视化——一篇文章足以(未完成)-2
|
数据可视化 数据挖掘 索引
python数据分析和可视化——一篇文章足以(未完成)-3
python数据分析和可视化——一篇文章足以(未完成)
118 0
python数据分析和可视化——一篇文章足以(未完成)-3
|
数据可视化 前端开发 数据挖掘
Pandas数据分析:快速图表可视化各类操作详解+实例代码(一)
Pandas数据分析:快速图表可视化各类操作详解+实例代码(一)
304 0
Pandas数据分析:快速图表可视化各类操作详解+实例代码(一)
|
数据库 数据格式 JSON
带你读《R数据科学实战:工具详解与案例分析》之一:数据导入工具
本书共11章,前6章主要介绍和讨论使用R语言的一般流程以及常用的R包;第7~11章,包含了5个实战案例,通过与前6章的内容相结合,展示如何使用这些R包。复现书中的代码需要读者对.Rproj有一定的了解,建议读者参阅网络教程学会使用.Rproj。使用.Rproj的原因在于其可以将每一次数据分析或练习都视为一个独立的项目(不必调用setwd函数重置工作路径),这样做不但可以减少代码出错的几率,而且还能更利于进行数据管理。
|
数据格式 数据挖掘 存储
带你读《R数据科学实战:工具详解与案例分析》之二:数据清理工具
本书共11章,前6章主要介绍和讨论使用R语言的一般流程以及常用的R包;第7~11章,包含了5个实战案例,通过与前6章的内容相结合,展示如何使用这些R包。复现书中的代码需要读者对.Rproj有一定的了解,建议读者参阅网络教程学会使用.Rproj。使用.Rproj的原因在于其可以将每一次数据分析或练习都视为一个独立的项目(不必调用setwd函数重置工作路径),这样做不但可以减少代码出错的几率,而且还能更利于进行数据管理。