数据分析--Matplotlib(一)

简介: 数据分析--Matplotlib

基本布局对象


figure对象是所有图表绘制的基础

构建图标的主要步骤

  • 准备数据
  • 生成图表
  • 传入数据
  • 调整图标的装饰


图表样式的修改以及图表装饰的接口


Matplotlib定义详细的图标装饰项接口,能够对图表几乎每一个细节进行修改

  • 修改图表样式
import matplotlib.pyplot as plt
import numpy as np
fig = plt.figure()
fig,axes = plt.subplots()
t = np.arange(0,2,0.01)
s = np.sin(2*np.pi*t)
# 修改线条颜色,线条形式
axes.plot(t,s,color='k',linestyle='-')
s = np.sin(2*np.pi*(t+0.5))
axes.plot(t,s,color='c',linestyle='--')
plt.show()


常用的color参数值


image.png


常用linesstyle参数值


image.png


  • 修改装饰项
import matplotlib.pyplot as plt
import numpy as np
fig = plt.figure()
fig,axes = plt.subplots()
t = np.arange(0,2,0.01)
s = np.sin(2*np.pi*t)
# 修改线条颜色,线条形式
axes.plot(t,s,color='k',linestyle='-',label='line1')
s = np.sin(2*np.pi*(t+0.5))
axes.plot(t,s,color='c',linestyle='--',label='line2')
# ticks styles
axes.set_xticks(np.arange(0,2,0.5))
axes.set_yticks([-1,0,1])
axes.minorticks_on()
# axes position
# 对边框进行修改,隐藏右边框和上边框
axes.spines['right'].set_color('none')
axes.spines['top'].set_color('none')
# 指定边框的位置,第一个参数表示位置的种类,第二个参数表示边框的位置
# axes.spines['bottom'].set_position(('data',0))
# axes.spines['left'].set_position(('data',0))
axes.spines['bottom'].set_position('center')
axes.spines['left'].set_position('zero')
# 'center' 等于('data',0.5)
# zero 等于 ('data',0)
# legend
# 设置图例,loc  bbox_to_anchor 确定位置的参数
axes.legend(loc='upper right',bbox_to_anchor=(1.1,1))
plt.show()


添加注释


import matplotlib.pyplot as plt
import  numpy as np
fig = plt.figure()
fig,axes = plt.subplots()
axes.plot(np.arange(0,24,2),[14,9,7,5,12,19,23,26,27,24,24,19],'-o')
axes.set_xticks(np.arange(0,24,2))
# 生成一个带箭头的注释
'''
axes.annotate('hottest at 16:00',xy=(16,27),xytext=(16,22),arrowprops=dict(
                facecolor = 'black',shrink=0.2),
                horizontalalignment='center',verticalalignment='center'
              )
    参数依次是 注释文字
    xy 箭头尖端位置
    xytext 注释文字位置
    arrowprops=dict(    箭头样式参数
                facecolor 箭头颜色
                shrink 箭头与文字之间的距离
                horizontalalignment verticalalignment 文字在水平位置和垂直位置向上对齐的方式
'''
axes.annotate('hottest at 16:00',xy=(16,27),xytext=(16,22),arrowprops=dict(
                facecolor = 'black',shrink=0.2),
                horizontalalignment='center',verticalalignment='center'
              )
'''
   axes.text() 
   参数分别为 文字的位置 注释文字 背景框的样式(课可以指定, 背景颜色 透明度 文字与背景框之间的距离)
'''
axes.text(12,10,'Date: March 26th 2018',bbox={'facecolor':'cyan','alpha':0.3,'pad':6})
plt.show()


基础图表绘制

直方图


是一种直观描述数据集集中每一个区间内数据值出现频数的统计图

通过直方图,可以大致了解数据的分布,判断数据集中的区间


import matplotlib.pyplot as plt
import numpy as np
data = np.random.standard_normal(1000)
# 分组
bins = 50
fig,axes = plt.subplots()
# 直方图
axes.hist(data,bins)
axes.set_title("Histogram")
plt.show()
# 直方图加标准正态密度函数图像
number_of_bins = 50
fig,axes = plt.subplots()
n,bins ,patch=axes.hist(data,number_of_bins,density=True)
standard_data = ((1/(np.sqrt(2*np.pi)*1))*np.exp(-0.5*(1/1*(bins-0))**2))
axes.plot(bins,standard_data,0,'-')
plt.show()


f93c0b6c4d2b42cc98846117455512f6.png

f70a57db6c4747d0be9f997dd44fd8a3.png

散点图


可以将样本数据绘制在二维平面上777直观的显示分布情况,初步判断两个变量之间的关系


import matplotlib.pyplot as plt
import numpy as np
n = 60
np.random.seed(100)
x = np.random.rand(n)
y = np.random.rand(n)
# plt.scatter(x,y)
fig,axes= plt.subplots()
axes.scatter(x,y)
plt.show()
# 根据值改变点大大小和颜色
n1 = 60
np.random.seed(100)
x = np.random.rand(n1)
y = np.random.rand(n1)
s = np.pi*(10*np.random.rand(n1))**2
c= -s
# plt.scatter(x,y)
fig,axes= plt.subplots()
# x y  标记点面积,颜色,透明度
axes.scatter(x,y,s,c,alpha=0.7)
plt.show()


61746c282043460ab3846094d3f05f28.png

6b82619276ac444282b249ab0570505d.png


饼图


饼图可以直观的显示某一类数据在全部样本数据的百分比


import matplotlib.pyplot as plt
import numpy as np
fig,axes = plt.subplots()
labels = 'Taxi','Metro','Walk','Bus','Bicycle','Driving'
sizes = [10,30,5,25,5,25]
explode = (0,0.1,0,0,0,0)
axes.pie(sizes,explode=explode,labels=labels,autopct='%1.1f%%',shadow=True,startangle=90)
axes.axis('equal')
axes.set_title('pie chart')
plt.show()


相关文章
|
4月前
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
68 1
|
5月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
97 2
|
4月前
|
存储 数据可视化 数据挖掘
揭秘!Matplotlib与Seaborn联手,如何让Python数据分析结果一目了然,惊艳全场?
在数据驱动时代,高效直观地展示分析结果至关重要。Python中的Matplotlib与Seaborn是两大可视化工具,结合使用可生成美观且具洞察力的图表。本文通过分析某电商平台的商品销量数据集,展示了如何利用这两个库揭示商品类别与月份间的销售关系及价格对销量的影响。首先使用Matplotlib绘制月份销量分布直方图,再借助Seaborn的箱线图进一步探索不同类别和价格区间下的销量稳定性。
75 10
|
4月前
|
机器学习/深度学习 数据可视化 数据挖掘
数据可视化大不同!Python数据分析与机器学习中的Matplotlib、Seaborn应用新视角!
在数据科学与机器学习领域,数据可视化是理解数据和优化模型的关键。Python凭借其强大的可视化库Matplotlib和Seaborn成为首选语言。本文通过分析一份包含房屋面积、卧室数量等特征及售价的数据集,展示了如何使用Matplotlib绘制散点图,揭示房屋面积与售价的正相关关系;并利用Seaborn的pairplot探索多变量间的关系。在机器学习建模阶段,通过随机森林模型展示特征重要性的可视化,帮助优化模型。这两个库在数据分析与建模中展现出广泛的应用价值。
62 2
|
4月前
|
数据可视化 数据挖掘 Python
逆袭之路!Python数据分析新手如何快速掌握Matplotlib、Seaborn,让数据说话更响亮?
在数据驱动时代,掌握数据分析技能至关重要。对于Python新手而言,Matplotlib和Seaborn是数据可视化的两大利器。Matplotlib是最基本的可视化库,适合绘制基础图表;Seaborn则提供高层次接口,专注于统计图形和美观样式。建议先学Matplotlib再过渡到Seaborn。快速上手Matplotlib需多实践,示例代码展示了绘制折线图的方法。Seaborn特色功能包括分布图、关系图及分类数据可视化,并提供多种主题和颜色方案。两者结合可实现复杂数据可视化,先用Seaborn绘制统计图,再用Matplotlib进行细节调整。熟练掌握这两者,将显著提升你的数据分析能力。
57 4
|
4月前
|
数据可视化 数据挖掘 Python
惊呆了!Python数据分析师如何用Matplotlib、Seaborn秒变数据可视化大师?
在数据驱动时代,分析师们像侦探一样在数字海洋中寻找线索,揭示隐藏的故事。数据可视化则是他们的“魔法棒”,将复杂数据转化为直观图形。本文将带你探索Python数据分析师如何利用Matplotlib与Seaborn这两大神器,成为数据可视化大师。Matplotlib提供基础绘图功能,而Seaborn在此基础上增强了统计图表的绘制能力,两者结合使数据呈现更高效、美观。无论是折线图还是箱形图,这两个库都能助你一臂之力。
50 4
|
4月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
【9月更文挑战第2天】数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
72 5
|
5月前
|
数据可视化 数据挖掘 API
Python数据分析:数据可视化(Matplotlib、Seaborn)
数据可视化是数据分析中不可或缺的一部分,通过将数据以图形的方式展示出来,可以更直观地理解数据的分布和趋势。在Python中,Matplotlib和Seaborn是两个非常流行和强大的数据可视化库。本文将详细介绍这两个库的使用方法,并附上一个综合详细的例子。
|
6月前
|
数据可视化 数据挖掘 Python
|
5月前
|
数据可视化 数据挖掘 Python
数据可视化不再难!Matplotlib带你轻松绘制精美图表,让数据分析焕发光彩!
【8月更文挑战第22天】今天分享如何用Python的Matplotlib库绘制多样图表。Matplotlib是数据可视化的强大工具,对数据分析至关重要。本文分六部分:首先介绍环境准备,包括安装和配置;随后通过四个案例演示折线图、柱状图、饼图及散点图的绘制方法;最后总结并鼓励大家进一步探索Matplotlib的丰富功能。跟着示例操作,你将学会基本图表的制作,提升数据展示技能。
53 0