数据可视化难在哪里?该如何入门

简介:

文章从几个方面简要分析了数据可视化,希望能够帮助你对数据可视化有一个整体的认识。

数据可视化是指将数据以视觉的形式来呈现,如图表或地图,以帮助人们了解这些数据的意义。通过观察数字、统计数据加以转换获得清晰的结论并不是一件容易的事。而人类大脑对视觉信息的处理优于对文本的处理,因此使用图表、图形和设计元素把数据进行可视化,可以帮你更容易的解释数据模式、趋势、统计规律和数据相关性,而这些内容在其他呈现方式下可能难以被发现。可视化可简明地定义为:通过可视表达增强人们完成某些任务的效率。

数据可视化难在哪里?该如何入门

任何形式的数据可视化都会由丰富的内容、引人注意的视觉效果、精细的制作三个要素组成,概括起来就是新颖而有趣、充实而高效、美感且悦目三个特征。

下面分别从数据可视化的价值、什么是好的可视化、数据可视化难在哪里、可视化过程中的注意事项、单个图表的构建过程几个方面聊聊数据可视化,最后推荐几本经典图书。

数据可视化的价值

数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。并且利用合适的图表直截了当且清晰而直观地表达出来,实现数据自我解释、让数据说话的目的。而人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍。因此,数据可视化能够加深和强化受众对于数据的理解和记忆。

图形表现数据,实际上比传统的统计分析法更加精确和有启发性。我们可以借助可视化的图表寻找数据规律、分析推理、预测未来趋势。另外,利用可视化技术可以实时监控业务运行状况,更加阳光透明,及时发现问题第一时间做出应对。例如天猫的双11数据大屏实况直播,可视化大屏展示大数据平台的资源利用、任务成功率、实时数据量等。

好的数据可视化

数据可视化能做到简单、充实、高效、兼具美感就是好的可视化:

  • 简单点说好的数据可视化和好的产品是一样,都有友好的用户体验,不能让人花了时间又看得一头雾水,甚至被误导得出错误的结论。准确 用最简单的方式传递最准确的信息,节约人们思考的时间。 最简单方式就是最合理的图表,需要根据比较关系、数据维数、数据多少选择。
  • 充实一份数据分析报告或者解释清楚一个问题,很少是单一一个的图表能够完成的,都需要多个指标或者同一指标的不同维度相互配合佐证分析结论。
  • 高效成功的可视化,虽表面简单却富含深意,可以让观察者一眼就能洞察事实并产生新的理解,管理者能够沿着你规划的可视化路径能够迅速地找到和发现决策之道。

美感除了准确、充实高效外,也需要美观。 美观分为两个层次,第一层是整体协调美,没有多余元素,图表中的坐标轴、形状、线条、字体、标签、标题排版等元素是经过合理安排的 ,UI设计中的四大原则(对比、重复、对齐、亲密性) 同样适用于图表。 第二层才是让人愉悦的视觉美,色彩应用恰到好处。把握好视觉元素中色彩的运用,使图形变得更加生动、有趣,信息表达得更加准确和直观。色彩可以帮助人们对信息进行深入分类、强调或淡化,生动而有趣的可视化作品的表现形式,常常给受众带来视觉效果上的享受。协调美是视觉美的基础。

数据可视化难在哪里

好的产品体验不是一件容易的事情,是专业产品经理、UE、UI完美配合的产物,同样做好数据可视化也不容易,需要具备一定的数据分析能力、熟练使用可视化工具、较好的美术素养、良好的用户体验感觉,还能够换位到受众角度审视自己的作品,光有理论远远不够,还需要大量的实践磨炼,把理论固化成自己的感觉。

  • 数据不准确、结论不是很清晰,所以数据可视化的最大难点在数据可视化之外的基础性工作,数据收集、数据分析没有做好,可视化就是徒劳无功。
  • 数据可视化是用高度抽象的图表展示复杂的数据、信息,需要逻辑及其严密
  • 维度多、变量多,不确定应该展示哪些信息 数据过多,需要采用交互式的展现可视化, 例如,可以充分利用地域的分级包含关系展示不同地域层次的图表。
  • 和UI图形界面相比,图表只有有限的文字、图形指引,不能很好的说明数据的上下文关系。
  • 图表高度抽象,对于阅读者素质要求很高,阅读者也需要了解各类图表所传递的对比关系、异同等基础知识。
  • 选择正确的图表不容易,各类图表都有自己的优势和局限性,光柱状图就有一般柱状图、分组柱状图、堆积柱状图、横线柱状图、双向柱状图等。
  • 图表细节处见真功夫,图表需要考虑细节实在是太多,布局、元素、刻度、单位、图例等等都需要合理。 细节处理不到位,影响可视化的效果,例如:折线太细不便于观察线太粗又抹平了趋势细节; 更严重问题可能误导受众, 例如:刻度选取不合理折线过于陡峭 。

可视化过程的注意事项

总结几点注意事项,少走些弯路:

  • 数据图表主要作用是传递信息,不要用它们选技巧,不要追求过分漂亮
  • 不要试图在一张图中表达所有的信息,不要让图表太沉重,适得其反
  • 数据可视化是以业务逻辑为主线串联,不要随意堆砌图表
  • 避免过度开发,什么数据都想展现,数据太多就选择最核心的数据指标、和正常偏差大的、能支持分析结论的
  • 不要试图掩盖问题,回避“不良结论”,真实反映业务,暴露问题
  • 慎用动态图表,尤其一个页面多个动态图表
  • 避免过度设计,一般不适用3D、阴影,合理运用色彩同样能让图表显示的很高级

数据产品的表现层可算作是大型的数据可视化项目,是产品设计方法和可视化方法的结合,分别掌握的产品设计方法和可视化方法然后综合运用不是什么难事,这里只说说单个图表的构建过程,以此引申出后续《图表可视化系列》文章

  • 明确图表想说明什么业务问题、业务逻辑 、数据分析结论
  • 确定关系和对比的维度,是时间趋势、比较,还是分布关系,对比维度(时间: 同比 环比 定基)、空间(华南 华北 区域与全国)、特定标准(实际和计划)
  • 根据对比关系,数据维度,数据分类多少选择合理的图表,每一种图表都有它自身的优点和局限性
  • 生成图表并验证是否正确,是否和预期一致
  • 细节调整,坐标轴(刻度标记类型、间隙、刻度标签位置、数据类型、小数位、是否千分位)、颜色取值、图例位置、图上标签、图表标题等细节
  • 在恰当处备注文字说明,例如标注特殊事件
  • 最后推荐几本数据可视化领域的经典图书,有时候网上刷再多的文章不如好好阅读一本书。

这两本都是浙江大学计算机学院教授、可视化专家陈为老师的著作,知识全面,非常体系化。从数据可视化的基础理论到各种类型数据的可视化方法,再到如何实际应用,可以算是数据可视化的百科全书或者专业教材。两本书内容基本一致,二选一即可,第一本是彩本,价格略贵。

作者根据数据可视化的一般顺序,先后介绍了如何获取数据,将数据格式化, 然后用可视化工具(如 R)生成图表,最后在图形处理软件(如 Illustrator)中修改完善,使图表达到最佳 的可视化效果。本书详细介绍了柱形图、饼图、折线图和散点图等图表的绘制方法及各自的优缺点,还用专门的一章介绍与地图相关的数据可视化技巧。

在常见的Javascript图表组件中,我最喜欢Google Chart,图表类型丰富,接口规范全面,能满足很多个性化的需求。  


本文作者:佚名

来源:51CTO

相关文章
|
机器学习/深度学习 存储 算法
时序数据特征工程浅析
内容摘要特征工程是指将原始数据标记处理为价值密度更高,更容易解释目标问题的工程化过程,在面向大量原始采集的数据集统计分析,尤其是对于高通量持续采集、且价值密度较低的时序数据更是如此。时序数据特征工程则是指利用有效方法,将原始时序数据转化为带有含义分类标签的序列数据片段或特征数值,例如,我们可以将指定时间窗口序列数据标识为特定异常关联数据,并保留平均、最大、最小值作为该序列的特征值。这样我们就可以围
4501 0
时序数据特征工程浅析
|
9月前
|
Java 测试技术
抖音点赞脚本,直播间作品批量点赞,jar插件代码分享
实现使用了Selenium WebDriver自动化测试框架来模拟浏览器操作。代码包含登录功能
拯救你的排版噩梦,搞定Deepseek到WPS的完美转换!
使用DeepSeek生成的文案复制到WPS后排版混乱?别担心,本文教你用LibreOffice解决此问题。首先下载并安装LibreOffice,然后将DeepSeek文案粘贴其中,保存为Word格式,最后用WPS打开,排版完美保留。简单四步,轻松搞定!
|
人工智能 安全 前端开发
免费高效!3步实现Llama3模型远程访问与协作
Meta发布了全新的开源大语言模型Llama 3,LM Studio是一款免费的桌面端工具,支持一键安装和运行Llama 3模型,实现本地使用。LM Studio还提供了Local Server功能,便于集成AI功能。通过贝锐花生壳,可轻松实现LM Studio接口的远程访问,无需公网IP或端口映射。
1185 1
|
文字识别 异构计算 Python
关于云端Jupyter Notebook的使用过程与感想
在自学Python时,由于家庭电脑使用冲突和设备老旧,转向云端平台。体验了多个服务:1. 魔搭modelscope(最喜欢,赠送资源丰富,社区活跃),2. Colaboratory(免费GPU,但有时重启,建议用阿里云),3. Deepnote(免费环境有限,但GPT-4代码生成功能强大),4. 飞桨aistudio(适合PaddlePaddle用户),5. ModelArts(曾有免费实例,现难找)。综合来看,阿里云的稳定性与服务更优,尤其是魔搭的自动代码修正功能。对于AIGC,推荐魔搭和付费版PAI-DSW。欢迎分享更多云端Jupyter平台体验。
987 1
|
算法 JavaScript 前端开发
国标非对称加密:RSA算法、非对称特征、js还原、jsencrypt和rsa模块解析
国标非对称加密:RSA算法、非对称特征、js还原、jsencrypt和rsa模块解析
1328 1
|
存储 机器学习/深度学习 缓存
APM-Elastic Stack 实战手册
应用程序性能管理(Application Performance Management)简称 APM。主要功能为监视和管理软件应用程序性能和可用性。
3432 0
APM-Elastic Stack 实战手册
|
算法
计算机网络——数据链路层-差错检测(奇偶校验、循环冗余校验CRC)
计算机网络——数据链路层-差错检测(奇偶校验、循环冗余校验CRC)
1850 0
|
Linux
Linux 学习笔记七:YUM安装软件
Linux 学习笔记七:YUM安装软件
483 0
|
SQL 算法 Java
花了三个小时打磨这道JAVA面试题,谈谈你对Seata的理解?
Seata在大厂也是属于高频的面试题,有一位3年工作经验的小伙伴被问到一道这样的面试题,说“谈谈你对Seata的理解”。那么,今天我给大家来聊一聊。
700 1