数据可视化的定义
数据可视化就是以图形的格式来呈现数据。它可以通过直观地呈现数据来减少数据的“噪音”,使决策者能够更容易地看到和理解数据中的趋势、异常值和模式。
地图和图表是最早的数据可视化形式之一。早期最著名的数据可视化例子之一是法国土木工程师Charles Joseph Minard在1869年创建的流程图,以帮助了解拿破仑的军队在1812年灾难性的俄国战役中所遭受的苦难。这张地图用两个维度来描绘了军队的数量、距离、温度、纬度和经度、行进方向以及相对于特定日期的位置。
如今,数据可视化涵盖了从仪表板到报表、统计图、热力图、图表、信息图等所有可视化呈现数据的方式。
数据可视化的商业价值
数据可视化可以帮助人们快速高效地分析数据。通过提供易于理解的可视化数据表示,可以帮助员工根据这些数据来做出更明智的决策。以视觉形式的呈现数据可以使其更容易被理解,使人们更快地获得见解。可视化也可以使这些见解更容易地被交流。数据的可视化表示也可以更容易地看到独立变量之间的关系。例如,它可以帮助企业查看趋势、了解事件的频率以及跟踪操作和性能之间的联系。
数据可视化的类型
可视化数据的方法有很多种,但数据设计机构Datalabs Agency表示,数据可视化有两种基本类型:
- 探索:探索可视化可帮助企业了解数据想要告诉你的内容。
- 解释:解释可视化会使用数据来向观众讲述故事。
理解一个给定的可视化要达到这两个目的中的哪一个是至关重要的。
一些最常见的特定可视化类型包括:
二维区域
这些通常是地理空间的可视化。例如,漫画利用地图的扭曲来传达诸如人口或旅行时间等信息。分级统计图上也会使用地图上的阴影或图案来表示统计变量,例如各州的人口密度。
时态
这是一种有一维线性的可视化,有一个开始和结束时间。例如时间序列,它按日或按月显示了网站访问量等数据,以及甘特图,它说明了项目进度。
多维
这些常见的可视化呈现通常会具有两个或更多维度的数据。示例包括了饼图、直方图和散点图。
分层
这些可视化显示了群体之间的关系。树形图是分层可视化的一个例子,它显示了较大的组是如何包含较小的组的。
网络
网络可视化显示了数据集在网络中是如何相互关联的。一个例子是节点链接图,也称为网络图,它使用了节点和链接线来显示事物是如何相互连接的。
数据可视化的示例
Tableau已经收集了它认为最好的10个数据可视化的例子。Tableau列表中的第一名就是上面提到的Minard的拿破仑向莫斯科进军的地图。其他突出的例子还包括:
- 1854年英国医生John Snow为了解当年伦敦霍乱爆发情况而制作的点阵图。该地图使用了城市街区的条形图来显示伦敦附近每个家庭的霍乱死亡人数。地图显示,受影响最严重的家庭都是从同一口井取的水,这最终让人们认识到,是受污水污染的井导致了疫情的爆发。
- 皮尤研究中心作为其The Next America项目的一部分,于2014年发布了一个生动的年龄和性别人口统计金字塔。该项目充满了创新的数据可视化。该图显示了自1950年代以来人口结构的变化,1950年代是底部有许多年轻人,顶部只有很少老年人的金字塔,到2060年则变成了矩形。
- Hanah Anderson和Matt Daniels在The Pudding网站上的四个可视化作品,通过分解2000部电影的脚本,统计了男性和女性角色的对白,阐明了流行文化中的性别差异。可视化包括了迪斯尼电影的分类,2000个剧本的概述,用户可以搜索特定电影的渐变条,以及对男性和女性角色的年龄偏见。
数据可视化的工具
有许多的应用程序、工具和脚本可用于数据可视化。其中最受欢迎的有:
Domo
Domo是一家专门从事商业智能工具和数据可视化的云软件公司。它侧重于商业用户部署的仪表板和易用性。
Dundas BI
Dundas BI是一个用于可视化数据、构建和共享仪表板和报表以及嵌入分析的BI平台。
Infogram
Infogram是一个拖放式的可视化工具,用于为营销报告、信息图、社交媒体帖子、仪表板等内容创建可视化的效果。
Microsoft Power BI
Microsoft Power BI是一个与Microsoft Office集成的商业智能平台。它有一个制作仪表板和报告的易于使用的界面。
Qlik
Qlik的Qlik Sense有一个用于调查数据的“关联”数据引擎并可以提供基于AI的可视化建议。它正在继续构建自己的开放架构和多云功能。
Sisense
Sisense是一个以嵌入式分析而闻名的端到端分析平台。许多客户以OEM的形式在使用它。
Tableau
作为市场上最流行的数据可视化平台之一,Tableau是一个支持访问、准备、分析和呈现数据的平台。
数据可视化的角色和薪资
根据PayScale的数据,以下是一些与数据分析相关的最受欢迎的职位,以及每个职位的平均薪资。
- 数据分析师:6.3万美元
- 数据科学家:9.2万美元
- 数据可视化专家:7.5万美元
- 高级数据分析师:8.5万美元
- 高级数据科学家:12.1万美元
- BI分析师:6.2万美元