Python基础之数据可视化

简介: Python基础之数据可视化

在日常工作中,枯燥的文字说明常常会令人望而却步,不如格式规范的表格容易让人接受,但通俗易懂的图表更会让人耳目一新,赏心悦目。本文主要一个简单的小例子,简述Python利用Matplotlib实现数据可视化的相关应用,仅供学习分享使用,如有不足之处,还请指正。

示例场景

当前公司人员冗余,需要裁掉两名实习生,但是具体裁掉哪一位,领导稍显为难,举棋不定。关于两名实习生的一年销售额业绩,如下表所示:

那到底哪一位实习生的销售业绩,及未来潜力更好呢?让我们通过可视化的方式进行对比。

引入模块包

工欲善其事必先利其器,要进行数据分析和可视化,首先是引入pandas模块和matplotlib模块,如下所示:

1. import pandas as pd
2. from matplotlib import pyplot as plt

读取数据

不管是哪一种图表方式,第一步都是先读取数据,本次读取数据主要通过pandas进行数据处理,如下所示:

1. # pandas 读取Excel,默认返回DataFrame类型,<class 'pandas.core.frame.DataFrame'>,属于二维列表
2. data = pd.read_excel('test.xls', sheet_name=0)
3. # print(type(data))
4. # print(data)

数据读取到内存中,是一个二维列表,数据类型为pandas.core.frame.DataFrame,是pandas中的数据类型,如下所示:

 

折线图

Matplotlib主要通过plot方法绘制折线图,如下所示:

1. plt.rcParams['font.family'] = ['sans-serif']
2. plt.rcParams['font.sans-serif'] = ['SimHei']
3. figure = plt.figure(figsize=(12, 6))
4. plt.title('销售额对比图')  # 标题
5. x = data['月份']  # x为一维列表,数据类型: <class 'pandas.core.series.Series'>
6. y1 = data['张三']  # 张三销售额
7. y2 = data['李四']  # 李四销售额
8. # print(type(x))
9. plt.plot(x,y1) # 基础折线图,采用描点连线的方式绘制
10. plt.plot(x,y2)
11. plt.show()  # 弹出框展示

简单设置后,生成的折线图,如下所示:

 

通过上图可以看出两位实习生的销售额趋势,孰优孰劣,但是上图略显粗糙,有一些地方表达差强人意,如:x轴,y轴的说明,两条线分别代表什么,需要更加细致的设置,如下所示:

1. plt.rcParams['font.family'] = ['sans-serif']
2. plt.rcParams['font.sans-serif'] = ['SimHei']
3. figure = plt.figure(figsize=(12, 6))
4. plt.title('销售额对比图')
5. x = data['月份']  # x为一维列表,数据类型: <class 'pandas.core.series.Series'>
6. y1 = data['张三']  # 张三销售额
7. y2 = data['李四']  # 李四销售额
8. # print(type(x))
9. plt.xlabel('月份')  # x轴说明
10. plt.ylabel('销售额')  # y轴说明
11. plt.xticks(x, ['%d月' % i for i in range(1, 13)])  # 采用列表推导式生成数组
12. 
13. # label 表示线的标签 color 表示线条的颜色,linestyle表示线条样式,marker表示点的样式
14. plt.plot(x,y1,label='张三',color='red',linestyle='--',marker='*')
15. plt.plot(x,y2,label='李四',color='green',linestyle='-.',marker='o')
16. plt.legend()
17. plt.show() # 弹出框展示

经过细致设置后,两位实习生的对比结果,如下所示:

 

折线注意事项

关于示例中marker的设置,如下所示:

1. **Markers**
2. 
3.         =============   ===============================
4.         character       description
5.         =============   ===============================
6.         ``'.'``         point marker
7.         ``','``         pixel marker
8.         ``'o'``         circle marker
9.         ``'v'``         triangle_down marker
10.         ``'^'``         triangle_up marker
11.         ``'<'``         triangle_left marker
12.         ``'>'``         triangle_right marker
13.         ``'1'``         tri_down marker
14.         ``'2'``         tri_up marker
15.         ``'3'``         tri_left marker
16.         ``'4'``         tri_right marker
17.         ``'8'``         octagon marker
18.         ``'s'``         square marker
19.         ``'p'``         pentagon marker
20.         ``'P'``         plus (filled) marker
21.         ``'*'``         star marker
22.         ``'h'``         hexagon1 marker
23.         ``'H'``         hexagon2 marker
24.         ``'+'``         plus marker
25.         ``'x'``         x marker
26.         ``'X'``         x (filled) marker
27.         ``'D'``         diamond marker
28.         ``'d'``         thin_diamond marker
29.         ``'|'``         vline marker
30.         ``'_'``         hline marker
31.         =============   ===============================

关于示例的linestyle设置,如下所示:

1. **Line Styles**
2. 
3.         =============    ===============================
4.         character        description
5.         =============    ===============================
6.         ``'-'``          solid line style
7.         ``'--'``         dashed line style
8.         ``'-.'``         dash-dot line style
9.         ``':'``          dotted line style
10.         =============    ===============================

柱状图

如果通过折线图,还不能决定孰优孰劣,那么下面再以柱状图的形式来分析,如下所示:

1. plt.rcParams['font.family'] = ['sans-serif']
2. plt.rcParams['font.sans-serif'] = ['SimHei']
3. figure = plt.figure(figsize=(12, 6))
4. plt.title('销售额对比图')
5. x = data['月份']  # x为一维列表,数据类型: <class 'pandas.core.series.Series'>
6. y1 = data['张三']  # 张三销售额
7. y2 = data['李四']  # 李四销售额
8. plt.bar(x,y1) # 默认柱状图,两根柱子会重叠
9. plt.bar(x,y2)
10. plt.legend()
11. plt.show()  # 弹出框展示

经过上述设置后,初步柱状图如下所示:

 

通过上图可以看出两位实习生的销售额对比,孰优孰劣,但是同样上图略显粗糙,有一些地方表达差强人意,如:x轴,y轴的说明,两根柱子分别代表什么,以及先绘制的图的值比较小时,会被覆盖,需要更加细致的设置,如下所示:

1. plt.rcParams['font.family'] = ['sans-serif']
2. plt.rcParams['font.sans-serif'] = ['SimHei']
3. figure = plt.figure(figsize=(12, 6))
4. plt.title('销售额对比图')
5. x = data['月份']  # x为一维列表,数据类型: <class 'pandas.core.series.Series'>
6. y1 = data['张三']  # 张三销售额
7. y2 = data['李四']  # 李四销售额
8. 
9. plt.xlabel('月份')  # x轴说明
10. plt.ylabel('销售额')  # y轴说明
11. plt.xticks(x, ['%d月' % i for i in range(1, 13)])  # 采用列表推导式生成数组
12. w = 0.4  # 柱子的宽度,默认为1,这里改为0.5
13. plt.bar((x - w / 2), y1, width=w, label='张三')
14. plt.bar((x + w / 2), y2, width=w, label='李四')
15. # 显示文本
16. for i in range(0, 12):
17.     plt.text(x=x[i] - w / 2, y=y1[i] + 5, s=y1[i], ha='center', va='center')
18.     plt.text(x=x[i] + w / 2, y=y2[i] + 5, s=y2[i], ha='center', va='center')
19. plt.legend()
20. 
21. plt.show()  # 弹出框展示

经过细致设置后,两位实习生的对比结果,如下所示:

 

备注

相信如果将两张图展示给领导看,公司领导会很快做出决定【前提是两位实习生背景简单,都是凭实力吃饭的非关系户】。关于Matplotlib的应用还有很多场景,本文旨在抛砖引玉,希望大家都能在工作生活中一帆风顺,事事如意。一首小诗,邀君共享。

《竹里馆》

【唐】王维

独坐幽篁里,弹琴复长啸。

深林人不知,明月来相照。

相关文章
|
3月前
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
57 1
|
1月前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
76 19
|
26天前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。
|
2月前
|
数据可视化 数据挖掘 Python
使用Python进行数据可视化:探索与实践
【10月更文挑战第21天】本文旨在通过Python编程,介绍如何利用数据可视化技术来揭示数据背后的信息和趋势。我们将从基础的图表创建开始,逐步深入到高级可视化技巧,包括交互式图表和动态展示。文章将引导读者理解不同图表类型适用的场景,并教授如何使用流行的库如Matplotlib和Seaborn来制作美观且具有洞察力的可视化作品。
48 7
|
1月前
|
数据可视化 定位技术 Python
使用Python进行数据可视化
【10月更文挑战第22天】在这篇文章中,我们将深入探讨如何使用Python进行数据可视化。我们将从基础的图表开始,然后逐步进入更复杂的可视化技术。我们将通过实例代码来展示如何实现这些可视化,以便读者能够更好地理解和应用这些技术。
36 5
|
2月前
|
数据可视化 Python
使用Python进行数据可视化的初学者指南
【10月更文挑战第20天】本文旨在为编程新手提供一个简洁明了的入门指南,通过Python语言实现数据可视化。我们会介绍如何安装必要的库、理解数据结构,并利用这些知识来创建基本图表。文章将用通俗易懂的语言和示例代码,帮助读者快速掌握数据可视化的基础技能。
37 4
|
2月前
|
数据可视化 Python
Python 高级绘图:探索数据可视化
在Python中,利用matplotlib、seaborn等库可实现数据的可视化。matplotlib功能丰富,支持基础图表绘制;seaborn则提供了更美观的默认样式。此外,matplotlib还支持3D图形及动态图表的生成,满足多样化的数据展示需求。 示例代码展示了如何使用这些库绘制正弦波、散点图、3D曲面图及动态更新的折线图。通过numpy生成数据,并借助matplotlib与seaborn的强大绘图功能,实现数据的直观呈现。
73 17
|
2月前
|
数据可视化 开发者 Python
使用Python进行数据可视化:从入门到精通
【10月更文挑战第7天】本文将引导您通过Python的可视化库,如Matplotlib和Seaborn,来探索和展示数据。我们将通过实际代码示例,学习如何创建各种图表,包括条形图、散点图和直方图等,并讨论如何优化这些图表以更好地传达信息。无论您是初学者还是有一定基础的开发者,这篇文章都能帮助您提高数据可视化技能。
|
2月前
|
数据可视化 Python
Python编程之数据可视化入门
【10月更文挑战第4天】在数字时代的洪流中,数据如同星辰般璀璨,而将它们绘制成图表,便是我们探索宇宙的方式。本文将带你启航,用Python这艘航船,驶向数据可视化的奥秘。我们将从安装必要的工具包开始,逐步深入到数据的呈现,最后通过代码示例点亮知识的灯塔,指引你在数据海洋中航行。让我们握紧舵盘,乘风破浪,揭开数据背后的故事吧!
|
2月前
|
存储 数据可视化 Python
Python编程中的数据可视化技术
在数据驱动的世界中,将复杂的数据集转换为易于理解的视觉表示形式至关重要。本文将深入探讨如何使用Python进行数据可视化,包括选择合适的库、处理数据和设计有效的图表。我们将一起学习如何让数据讲故事,并确保你的信息传达清晰且有影响力。