可视化工具使用简介

简介: 可视化工具使用简介

    所谓可视化,就是采用图表来展示数据的分布状况或变化趋势。常用的Python可视化工具包是Matplotlib和Seaborn。下面结合鸢尾花数据集介绍绘制直方图、散点图、饼图、密度图和折线图的做法。目的是帮助读者初步认识数据可视化。要入门数据可视化的话,建议阅读相关书籍并且多多练习。

     我们将使用Jupyter Notebook来编写和运行关于数据可视化的代码。这些代码涉及绘制图表的工作。首先,我们要做以下准备工作:

(1) 启动Jupyter Notebook。

(2) 单击进入一个文件夹(比如选择Desktop文件夹)。

(3) 新建一份交互式文档,把文档命名为“iris-visualization”。

(4) 在第1个代码输入框内敲入图所示的代码,按“Shift + Enter”运行这组代码。

     Jupyter Notebook的使用详述了以上步骤的具体做法。完成以上6个步骤后,浏览器内的Notebook页面如图所示。

数据可视化实验的准备工作

     下面两个输入框内输入分别输入一行代码。第一个输入框的代码是调用Pandas的read_csv函数加载保存在“Iris.csv”文件内的数据。第二个参数“index_col=0”指定首列作为索引列(即标签列)。read_csv函数返回一个DataFrame赋值给iris_data变量。

     第二个输入框内,调用DataFrame的head方法,显示iris_data内的前5行数据。从输出结果来看,该鸢尾花(Iris)数据集有5个字段,依次是花萼长度(Sepal.Length)、花萼宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)和类别(Species)。

     下面的代码调用info方法观察Iris数据集的整体信息。从输出内容中可以看出,数据集一共有150行,没有缺失数据的情况。

     下面的代码调用describe方法观察Iris数据集的数字型字段的信息。从输出内容中,我们可以了解到花萼长度(Sepal.Length)、花萼宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)的平均值、最大值和最小值等信息。

     下面的代码调用hist方法绘制直方图。第1行代码中,“iris_data[‘Petal.Length’]”是得到“Petal.Length”字段的属性值,这是一个Series类型的值,而后调用hist方法绘制直方图。第2行代码“plt.show()”是把直方图显示在网页上。

     直方图告诉我们各种长度的花瓣的数量。例如,长度为1到1.5的花瓣的数量多于35个。长度为1.5到2.2的花瓣的数量多于10个,小于15个。

     下面的代码调用DataFrame的hist方法绘制花萼长度(Sepal.Length)、花萼宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)的直方图。

     下面的代码调用DataFrame的plot方法绘制散点图。plot方法的第三个参数“kind=’scatter’”指定生成一幅散点图。

     代码下方的散点图中,每一个圆点代表一个样本。这里,一个样本是一朵鸢尾花的花瓣长度和花瓣宽度。X轴是花瓣长度,Y轴是花瓣宽度。通过散点图,我们可以看出样本分布情况。

     下面的代码调用value_counts方法统计了150个鸢尾花样本的类别及其样本数。从输出结果可以发现,这150个样本分3类,第一类的名称是virginica,有50个样本。第二类的名称是setosa,有50个样本。第三类的名称是versicolor,有50个样本。

下面的代码绘制饼图,给出3种类别各自的占比。

     

     下面的代码绘制了花瓣长度的KDE密度图。KDE密度图是模拟样本值概率分布的图。

     下面的代码绘制了花萼长度(Sepal.Length)、花萼宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)的密度图。

     下面的代码绘制了150个样本的花瓣长度的折线图。输出的折线图中,横轴是样本编号,纵轴是花瓣长度(位于1到7.0区间内)。从输出的折线图中可以看出花瓣长度大致分成3组。

     下面的代码绘制了花瓣宽度的折线图。输出的折线图中,横轴是样本编号,纵轴是花瓣长度(位于0.0到2.5区间内)。从输出的折线图中可以看出花瓣宽度大致分成3组。


相关文章
|
2月前
|
数据可视化 Ubuntu 机器人
WebViz可视化工具的应用
【10月更文挑战第2天】WebViz可视化 Webviz是一个基于Web的可视化工具,意味着您可以通过浏览器/APP访问它,而不需要安装额外的软件。这对于远程访问和团队协作非常方便。 Foxglove是一个开源的工具包,包括线上和线下版。旨在简化机器人系统的开发和调试。它提供了一系列用于构建机器人应用程序的功能。 本节将介绍如何使用Foxglove进行数据查看,以及话题通信。 为了实现OriginBot与Foxglove的连接,我们需要在OriginBot上搭建ROS环境。请确保您的机器人是OriginBot(视觉版/导航版),并且您的PC运行的是Ubuntu(≥20.04)或Win
|
7月前
|
数据可视化 JavaScript 前端开发
【专栏】D3.js 和 Tableau 是两种流行的数据可视化工具
【4月更文挑战第27天】D3.js 和 Tableau 是两种流行的数据可视化工具。D3.js,一个JavaScript库,以其灵活性和定制性著称,适合创建复杂、个性化的可视化效果,但需要编程技能。Tableau,一款用户友好的分析软件,提供直观界面和强大分析功能,适合快速生成常见图表。在选择时,应考虑项目需求、团队技术能力、数据规模和性能要求。两者可单独使用,也可结合发挥各自优点。随着数据可视化需求的增长,这些工具将持续发展并提供更好的解决方案。
186 1
|
7月前
|
数据可视化 数据挖掘 Linux
Seaborn入门:数据可视化利器初体验
【4月更文挑战第17天】Seaborn是Python的数据可视化库,基于matplotlib提供更高级别的接口。本文介绍了Seaborn的安装、基本绘图功能,如散点图、直方图和箱线图,以及主题和样式的设置。Seaborn自带数据集便于练习,且支持复杂的数据分析任务,如成对关系图和热力图。它是数据可视化的强大工具,适用于科研和数据分析报告。
|
7月前
|
Prometheus 数据可视化 数据库
可视化工具Grafana:简介及安装
可视化工具Grafana:简介及安装
137 0
|
7月前
|
数据可视化 Python
介绍一个有趣的可视化工具,超Q!
介绍一个有趣的可视化工具,超Q!
介绍一个有趣的可视化工具,超Q!
|
7月前
|
数据可视化 定位技术
Tableau可视化设计案例-05Tableau进阶
Tableau可视化设计案例-05Tableau进阶
|
数据可视化 JavaScript 前端开发
数据可视化工具|学习笔记
快速学习数据可视化工具
数据可视化工具|学习笔记