【可视化】图表展示中的10个经典问题

简介:


一直想写这样一本介绍数据可视化的书。可以介绍一些日常办公中常常用到的图表处理的技巧并且能够推荐给读者一些非常优秀的小工具,比如Xcelsius、Smartdraw、Visio、Swiff Chart、ColorWheel、Tableau、Ucinet、Excel、PPT、Mindmanager等等。


几乎所有的报告都离不开数据图表的应用,但是在图表应用的过程中似乎往往会遇到各种各样的问题。比如词不达意、数据与图形步匹配、图表配色不协调等等。所以我也想能够通过这样一本书抛砖引玉,为图表的制作提供参考。


那下面是我浏览到的一个关于图形运用的测试,非常不错,我就将其贴出与大家分享:


1、下面两个图形中,那个更容易表现Mid-Cap和Small-Cap的市场份额大小,饼图还是条形图?

点评:一般来讲表述市场份额是100%,所以大家习惯用饼图表述,研究表明人们更习惯从条形图来比较大小,更醒目的看到差异!


2、立体的图表是否比平面的图形更容易解读?

点评:从简约的角度,显然二维图更适合人们观察,当然大部分图表需要打印在平面;三维并不适合观察,所以只要可能尽量用二维图,毕竟是我们视觉空间的最低维度!当然上面的图是时间轴应该采用折线图表述趋势!


3、交叉表恐怕还是简洁的好!


点评:简约就是美,显然下面的更清晰明快!我们习惯采用中国式图表,一般都是封闭边框线的,但是我们如果经常看英文的论文,你会发现很多论文都是下面的图表!在文章中,大家最好让表格内字体小于正文1个字号,保持非封闭的表格会有不一样的视角效果,似乎更显专业水准!当然中西文化的差异也可能存在不同观点!


4、横坐标是时间序列,为了展现数据的趋势,应该选线图还是柱形图?(这个问题比较普遍)

点评:选择下面的最重要的是X轴是时间,时间序列,所以折线图更能够感知的趋势、模式的变化!当然如果你表现的是不同品牌的市场份额,条形图或直方图也是可以的!


5、在不同的场合应该选择将真实数据比例展示出来还是将差异放大?

点评:这两个图的最大差异是Y轴坐标,显然B图是真实的表现,并不存在“显著”差异,而A图是用放大镜在寻找差异,那么采用B是真实的;如果你想强调差异性,也应该在提供了B图之后,采用引线标明A图是来自B图的放大效果!


6、热力图的制作经常用吧,左右两个有什么区别?


点评:地理信息是可视化的重要表现形式,在数据呈现中不断增加地理信息元素是非常重要的,从事分析的人要有采用地理信息呈现的思维方式,不断提炼,日积月累就会有好的模板了!当然上面的左图依然满足简约就是美的原则,同时我们知道地图的四色原理,颜色的基本规则也是不用超过4种,不行采用渐变颜色;现在活动地图还是比较容易的,大家可以从Google Map和一些Go2map等软件截取恰当的地理信息,然后用心抠图就可以用来,当然这是比较笨但也是有效的方法,高级的可以采用PS等技术抠图啦!当然,如何让地图与数据大小联动呈现,需要编写宏或者VBA的一点语句支持!


7、又遇3D和2D的问题,上面的3D图表相对于下面的四个2D表分列节省了空间,但是所传达的信息呢?

点评:我们说了尽量不用用三维图,但是大家是不是会把信息按某个维度作出分散的二维图呢,一定注意要去掉后面图的纵坐标的Lable,否则是四张图,要贴成一张图!


8、常用Excel的人恐怕对下面的图表深有体会吧,横坐标的标签名称太长怎么办?旋转呗?

点评:当然左侧的图的Label更好看,但我们会作出这样的Lable吗?最笨也是最没有办法的办法就是把Label变成图片贴上去盖住原来的;当然,Excel是可以实现的,只要在标签单元格用Alt+Enter就可以在一个单元格输入多行标签了;如果不想改变原来的文本格式,就让单元格引用其它位置就可以了,所以在图表中要有能力和用心去修改图表中的每一个元素!


9、鲜艳的背景颜色会对数据展现产生什么影响?

点评:我们应该选下面的,如果选上面的打印都费墨,坚持简单是最好的;当然如果有艺术细胞的话,背景也是生动的,但是更多是考虑展示结果,如果最终要打印你就要考虑考虑啦!

10、哪张表里面能够一目了然的发现问题所在?


点评:我们应该选择上面的,因为网格线会让我们看不清晰,最好不要用网格线;当然颜色也是非常重要的,记住条件格式的应用,别一点一点的把数值变字体颜色,要用规则变;当然细节也是非常重要的,比如字体、数值、对齐等格式问题,这些都有助于领导欣赏!


至此,关于这个图形测试的十道问题都已经贴出。怎么样,大家平时遇到过这么问题么?



原文发布时间为:2015-11-07

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
1854 2
|
SQL 消息中间件 分布式计算
Apache Doris 系列: 入门篇-数据导入及查询
Apache Doris 系列: 入门篇-数据导入及查询
1796 0
|
SQL 分布式计算 API
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
Spark学习------SparkSQL(概述、编程、数据的加载和保存)
290 2
|
存储 运维 Oracle
国产数据库:目前最火的五款国产数据介绍
随着互联网的高速发展,目前数据的存储越来越多,传统的数据库逐渐不能满足人们对海量数据、高效查询的需求,国产的数据库如雨后春笋一样,一个个冒了出来来解决我们高速科技发展的数据库瓶颈,今天就给大家聊一聊目前最火的五款国产数据库,大家一起来交流一下。
国产数据库:目前最火的五款国产数据介绍
|
Java UED
Java中String强转int:一种常见的错误和解决方法
在Java中将非数字字符串转换为整数会导致`NumberFormatException`。要解决这个问题,可以使用`try-catch`捕获异常,正则表达式验证数字格式,或利用异常信息提供错误提示。例如,`Integer.parseInt()`会因遇到非数字字符如`"123abc"`而抛出异常,但通过异常处理或正则`\\d+`可确保安全转换。记得在编程时避免直接强转,以防止程序异常中断。
|
10月前
|
XML Java 开发者
论面向方面的编程技术及其应用(AOP)
【11月更文挑战第2天】随着软件系统的规模和复杂度不断增加,传统的面向过程编程和面向对象编程(OOP)在应对横切关注点(如日志记录、事务管理、安全性检查等)时显得力不从心。面向方面的编程(Aspect-Oriented Programming,简称AOP)作为一种新的编程范式,通过将横切关注点与业务逻辑分离,提高了代码的可维护性、可重用性和可读性。本文首先概述了AOP的基本概念和技术原理,然后结合一个实际项目,详细阐述了在项目实践中使用AOP技术开发的具体步骤,最后分析了使用AOP的原因、开发过程中存在的问题及所使用的技术带来的实际应用效果。
240 5
|
Java API 开发者
Java 注释规范
Java中的注释规范包括单行注释(`//`)、多行注释(`/* ... */`)和文档注释(`/** ... */`)。单行注释适用于简短说明,多行注释用于较长描述,文档注释则专为自动生成API文档设计。注释应清晰明了、及时更新,避免冗余,并详细说明参数和返回值。遵循这些规范有助于提高代码的可读性和可维护性。
658 5
|
SQL 关系型数据库 MySQL
MySQL 常见日志清理策略
MySQL 数据库服务器使用多种类型的日志来记录操作和事件,这对于故障诊断、审计和性能分析非常重要。然而,这些日志文件会随着时间的推移而不断增长,可能会占用大量的磁盘空间。因此,定期清理这些日志是必要的,本篇文章我们一起来学习下如何清理 MySQL 中的日志文件。
584 3
|
算法 Python
群智能算法:灰狼优化算法(GWO)的详细解读
在优化问题中,寻找最优解是核心目标。灰狼优化算法(GWO)受到自然界灰狼狩猎行为和社会等级结构的启发,通过模拟Alpha(头狼)、Beta(助手狼)、Delta(支配狼)和Omega(普通狼)的角色,高效搜索最优解。本文详细解析GWO的原理与步骤,并提供Python代码实现,帮助读者理解并应用这一算法。
|
消息中间件 存储 微服务
20-微服务技术栈(高级):MQ死信队列&TTL&延迟队列
消息中间件,作为分布式系统中必不可少的一部分,在前面我们学习过其基本的消息发送、消费,但是读者朋友们肯定也知道,真正的生产环境可不是简单的发送消息这么简单。如何避免消息丢失?如何满足特殊场景下的消息延迟消费?如何解决消费能力不足?如何搭建集群?等等 本节笔者将从消息的可靠性出发,解决消息不丢失的问题。同时借助TTL实现延迟消息,惰性队列解决消息堆积问题,最后完成集群搭建以实现生产环境真正的高可用。
421 0