数据可视化(一):介绍

简介: 数据可视化(一):介绍

1. 可视化介绍

数据可视化(英语:Data visualization),主要旨在借助于图形化手段,清晰有效地传达与沟通信息。 为了清晰有效地传递信息,数据可视化通常使用柱状图、折线图、饼图、玫瑰图、散点图等图形来传递信息,也可以使用点、线、面、地图来对数字数据进行编码展示,以便在视觉上快速传达关键信息,可视化可以帮助用户分析和推理数据,让复杂的数据更容易理解和使用,有利于做出决策。

就像你看下图中的表格很难看出什么,但是你看下面的可视化图标,就能很轻易的分辨出各类数据间的比较以及趋势。
image.png

2. 可视化的历史

1. 萌芽阶段

早在 17 世纪以前,可视化就开始萌芽了,其中最早的地图在公元前 6200 年于土耳其地区出现。现代考古发现我国最早的地图实物,是出土于甘肃天水放马滩战国墓地一号墓中的《放马滩地图》。

17 世纪末随着几何兴起、坐标系、以及人口统计学开端,人类开始了可视化思考的新模式,从此标记可视化的开端

1800-1849年:随着工艺设计的完善,统计图形爆炸性增长,包括柱状图, 饼图, 直方图, 折线图等

1826 年,查尔斯·杜品发明了使用连续黑白底纹来显示法国识字分布,这可能是第一张现代形式主题统计地图。

image.png

2. 黄金阶段

1850-1899:人们开始认识到数字信息对社会计划,工业化,商业和运输的重要性,此时统计理论开始诞生。

1869年查尔斯·约瑟夫·米纳德,发布的拿破仑对 1812 年俄罗斯东征事件流图,被誉为有史以来最好的数据可视化。他的流图呈现了拿破仑军队的位置和行军方向、军队汇集、分散和重聚的时间和地点等信息。

1879年 Luigi Perozzo 绘制立体图(三维人口金字塔)。标记着可视化开始进入了三维立体图

image.png

3. 重生阶段

1950-1974 年:引领这次大潮的,首先是一个划时代的事件——计算机的诞生

计算机的出现彻底地改变了数据分析工作,计算机高分辨率和交互式的图形分析,提供了手绘时代无法实现的表现能力。

随着统计应用的发展,数理统计把数据可视化变成了一门科学(如:计算机图形学、统计学、分析学),并运用到各行各业。

1969年 John W. Tukey 在探索数据分析的图形时,发明箱型图。

1982年乔治·罗里克(George Rorick)绘制彩色天气图开创了报纸上的彩色信息图形时代

1996年 Jason Dykes 发明了制图工具:一种地图可视化工具包,可以实时查看数据的图形工具。

4. 分析学阶段

2004 年至今

以前可视化难以应对海量、高维、多源的动态数据的分析,进入21世纪,随着计算机的升级,对于以前难以应对数据,可以借用计算机来综合可视化、图形学、数据挖掘理论与方法来研究新的科学理论模型。通过这种模型来辅助用户从海量、复杂、矛盾的数据中快速挖掘出有用的数据,做出有效决策,这门新兴学科称为可视化分析学

可视化分析现在已大量应用在地图、物流、电力、水利、环保、交通、医学、监控、预警等领域。可视化分析降低了数据理解的难度,突破了常规统计分析的局限性。如下交通拥挤分析图。随着大数据的应用,如今可视化开发也变得越来越重要了。

image.png

3. 可视化应用场景

随着近几年大数据的快速发展,数据可视化技术也迅速被普及。目前数据可视化的应用非常广:

  • 如淘宝双十一活动时,借助于数据可视化展示公司实时交易数额,并可以实时动态观察。
  • 交管部门可实现对交通形态、卡口数据统计、违章分析、警力部署、出警分析、行车轨迹分析等智能交通大数据分析。
  • 企业各层可以借助数据可视化工具,可以直接在手机等设备上远程查看业务运营数据状况和关键指标。
  • 医院可以利用数据可视化工具,对医疗卫生数据进行可视化分析和研究应用,进而获取医疗卫生数据隐藏的价值。
  • 等等

image.png

image.png

4. 可视化的解决方案

前端可视化技术

  1. 底层图形引擎:SkiaOpenGL 等。
  2. W3C提供:CSS3CanvasSVGWebGL
  3. 第三方的可视化库: ZRenderEchartsAntVHighchartsD3.jsthree.js百度地图高德地图 等等。
  4. 低代码可视化平台:阿里云(DataV)腾讯云图网易有数(EasyScreen)帆软 等。
相关文章
|
存储 数据采集 人工智能
AI时代:云存储加速多模态数据存储与管理创新
阿里云存储产品高级解决方案架构师欧阳雁(乐忱)分享了中国企业在全闪存高端存储市场的快速增长,指出AI大模型的发展推动了企业级存储市场。去年,高端企业级存储闪存占比约为25%,相较于欧美50%的比例,显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程,包括数据预处理、训练和推理的痛点,以及针对这些环节的存储解决方案,强调了稳定、高性能和生命周期管理的重要性。此外,还介绍了数据预处理的全球加速和弹性临时盘技术,训练阶段的高性能存储架构,推理场景的加速器和AI Agent的应用,以及应对大数据业务的存储考量,如对象存储、闪电立方和冷归档存储产品。
39762 20
|
存储 测试技术 编译器
面向 C++ 的现代 CMake 教程(三)(5)
面向 C++ 的现代 CMake 教程(三)
211 1
|
11月前
|
Java
jdk11的HttpClient
本文介绍了JDK 11中新增的HttpClient功能,并通过示例代码展示了如何使用它来发送HTTP请求,包括GET请求和异步请求的处理。
231 2
jdk11的HttpClient
|
12月前
|
JSON JavaScript 前端开发
Google Charts
Google Charts
287 4
|
12月前
|
数据采集 数据可视化 数据挖掘
数据清洗(Data Cleaning)
数据清洗(Data Cleaning)
605 1
|
机器学习/深度学习 数据采集 资源调度
【机器学习】逻辑回归:原理、应用与实践
逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计学方法,尽管其名称中含有“回归”二字,但它实际上是一种用于解决二分类或多分类问题的线性模型。逻辑回归通过使用逻辑函数(通常为sigmoid函数)将线性模型的输出映射到概率空间,从而预测某个事件发生的概率。本文将深入探讨逻辑回归的理论基础、模型构建、损失函数、优化算法以及实际应用案例,并简要介绍其在机器学习领域的地位和局限性。
695 2
|
机器学习/深度学习 监控 算法
基于YOLOv8深度学习的智能肺炎诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战
基于YOLOv8深度学习的智能肺炎诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战
|
机器学习/深度学习 人工智能 分布式计算
因果推断:效应估计的常用方法及工具变量讨论
日常工作中很多的策略/产品的效果是无法设计完美的随机实验的,要求我们从观察性数据中去(拟合随机试验)发现因果关系、测算因果效应。
2335 0
因果推断:效应估计的常用方法及工具变量讨论
|
数据安全/隐私保护 索引
Kibana安装部署
Kibana安装部署
|
Docker Python Windows
Docker selenium 自动化 - 使用python操作docker,python运行、启用、停用和查询容器实例演示
Docker selenium 自动化 - 使用python操作docker,python运行、启用、停用和查询容器实例演示
1324 0
Docker selenium 自动化 - 使用python操作docker,python运行、启用、停用和查询容器实例演示