25 个常用 Matplotlib 图的 Python 代码(四)

简介: 大家好,今天要分享给大家25个Matplotlib图的汇总,在数据分析和可视化中非常有用,文章较长,可以马起来慢慢练手。

16. 棒棒糖图

棒棒糖图表以一种视觉上令人愉悦的方式提供与有序条形图类似的目的。

# Prepare Data

df_raw = pd.read_csv("https://github.com/selva86/datasets/raw/master/mpg_ggplot2.csv")

df = df_raw[['cty', 'manufacturer']].groupby('manufacturer').apply(lambda x: x.mean())

df.sort_values('cty', inplace=True)

df.reset_index(inplace=True)


# Draw plot

fig, ax = plt.subplots(figsize=(16,10), dpi= 80)

ax.vlines(x=df.index, ymin=0, ymax=df.cty, color='firebrick', alpha=0.7, linewidth=2)

ax.scatter(x=df.index, y=df.cty, s=75, color='firebrick', alpha=0.7)


# Title, Label, Ticks and Ylim

ax.set_title('Lollipop Chart for Highway Mileage', fontdict={'size':22})

ax.set_ylabel('Miles Per Gallon')

ax.set_xticks(df.index)

ax.set_xticklabels(df.manufacturer.str.upper(), rotation=60, fontdict={'horizontalalignment': 'right', 'size':12})

ax.set_ylim(0, 30)


# Annotate

for row in df.itertuples():

   ax.text(row.Index, row.cty+.5, s=round(row.cty, 2), horizontalalignment= 'center', verticalalignment='bottom', fontsize=14)


plt.show()

50.jpg


17. 包点图

点图表传达了项目的排名顺序。由于它沿水平轴对齐,因此您可以更容易地看到点彼此之间的距离。

# Prepare Data

df_raw = pd.read_csv("https://github.com/selva86/datasets/raw/master/mpg_ggplot2.csv")

df = df_raw[['cty', 'manufacturer']].groupby('manufacturer').apply(lambda x: x.mean())

df.sort_values('cty', inplace=True)

df.reset_index(inplace=True)


# Draw plot

fig, ax = plt.subplots(figsize=(16,10), dpi= 80)

ax.hlines(y=df.index, xmin=11, xmax=26, color='gray', alpha=0.7, linewidth=1, linestyles='dashdot')

ax.scatter(y=df.index, x=df.cty, s=75, color='firebrick', alpha=0.7)


# Title, Label, Ticks and Ylim

ax.set_title('Dot Plot for Highway Mileage', fontdict={'size':22})

ax.set_xlabel('Miles Per Gallon')

ax.set_yticks(df.index)

ax.set_yticklabels(df.manufacturer.str.title(), fontdict={'horizontalalignment': 'right'})

ax.set_xlim(10, 27)

plt.show()51.jpg

18. 坡度图

斜率图最适合比较给定人/项目的“之前”和“之后”位置。

import matplotlib.lines as mlines

# Import Data

df = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/gdppercap.csv")


left_label = [str(c) + ', '+ str(round(y)) for c, y inzip(df.continent, df['1952'])]
right_label
= [str(c) + ', '+ str(round(y)) for c, y inzip(df.continent, df['1957'])]
klass
= ['red'if (y1-y2) < 0else'green'for y1, y2 inzip(df['1952'], df['1957'])]

# draw line
# https://stackoverflow.com/questions/36470343/how-to-draw-a-line-with-matplotlib/36479941
def newline(p1, p2, color='black'):
   ax
= plt.gca()

   l = mlines.Line2D([p1[0],p2[0]], [p1[1],p2[1]], color='red'if p1[1]-p2[1] > 0else'green', marker='o', markersize=6)

   ax.add_line(l)

   return l


fig, ax = plt.subplots(1,1,figsize=(14,14), dpi= 80)


# Vertical Lines

ax.vlines(x=1, ymin=500, ymax=13000, color='black', alpha=0.7, linewidth=1, linestyles='dotted')

ax.vlines(x=3, ymin=500, ymax=13000, color='black', alpha=0.7, linewidth=1, linestyles='dotted')


# Points

ax.scatter(y=df['1952'], x=np.repeat(1, df.shape[0]), s=10, color='black', alpha=0.7)

ax.scatter(y=df['1957'], x=np.repeat(3, df.shape[0]), s=10, color='black', alpha=0.7)


# Line Segmentsand Annotation

for p1, p2, c inzip(df['1952'], df['1957'], df['continent']):
   newline([1,p1], [3,p2])
   ax.text(1-0.05, p1, c + ', ' + str(round(p1)), horizontalalignment
='right', verticalalignment='center', fontdict={'size':14})

   ax.text(3+0.05, p2, c + ', ' + str(round(p2)), horizontalalignment='left', verticalalignment='center', fontdict={'size':14})


# 'Before' and 'After' Annotations

ax.text(1-0.05, 13000, 'BEFORE', horizontalalignment='right', verticalalignment='center', fontdict={'size':18, 'weight':700})

ax.text(3+0.05, 13000, 'AFTER', horizontalalignment='left', verticalalignment='center', fontdict={'size':18, 'weight':700})


# Decoration

ax.set_title("Slopechart: Comparing GDP Per Capita between 1952 vs 1957", fontdict={'size':22})

ax.set(xlim=(0,4), ylim=(0,14000), ylabel='Mean GDP Per Capita')

ax.set_xticks([1,3])

ax.set_xticklabels(["1952", "1957"])

plt.yticks(np.arange(500, 13000, 2000), fontsize=12)


# Lighten borders

plt.gca().spines["top"].set_alpha(.0)

plt.gca().spines["bottom"].set_alpha(.0)

plt.gca().spines["right"].set_alpha(.0)

plt.gca().spines["left"].set_alpha(.0)

plt.show()


52.jpg

19. 哑铃图

哑铃图传达各种项目的“前”和“后”位置以及项目的排序。如果您想要将特定项目/计划对不同对象的影响可视化,那么它非常有用。

import matplotlib.lines as mlines


# Import Data

df = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/health.csv")

df.sort_values('pct_2014', inplace=True)

df.reset_index(inplace=True)


# Func to draw line segment

defnewline(p1, p2, color='black'):

   ax = plt.gca()

   l = mlines.Line2D([p1[0],p2[0]], [p1[1],p2[1]], color='skyblue')

   ax.add_line(l)

   return l


# Figure and Axes

fig, ax = plt.subplots(1,1,figsize=(14,14), facecolor='#f7f7f7', dpi= 80)


# Vertical Lines

ax.vlines(x=.05, ymin=0, ymax=26, color='black', alpha=1, linewidth=1, linestyles='dotted')

ax.vlines(x=.10, ymin=0, ymax=26, color='black', alpha=1, linewidth=1, linestyles='dotted')

ax.vlines(x=.15, ymin=0, ymax=26, color='black', alpha=1, linewidth=1, linestyles='dotted')

ax.vlines(x=.20, ymin=0, ymax=26, color='black', alpha=1, linewidth=1, linestyles='dotted')


# Points

ax.scatter(y=df['index'], x=df['pct_2013'], s=50, color='#0e668b', alpha=0.7)

ax.scatter(y=df['index'], x=df['pct_2014'], s=50, color='#a3c4dc', alpha=0.7)


# Line Segments

for i, p1, p2 in zip(df['index'], df['pct_2013'], df['pct_2014']):

   newline([p1, i], [p2, i])


# Decoration

ax.set_facecolor('#f7f7f7')

ax.set_title("Dumbell Chart: Pct Change - 2013 vs 2014", fontdict={'size':22})

ax.set(xlim=(0,.25), ylim=(-1, 27), ylabel='Mean GDP Per Capita')

ax.set_xticks([.05, .1, .15, .20])

ax.set_xticklabels(['5%', '15%', '20%', '25%'])

ax.set_xticklabels(['5%', '15%', '20%', '25%'])    

plt.show()

53.jpg20. 连续变量的直方图

直方图显示给定变量的频率分布。下面的表示基于分类变量对频率条进行分组,从而更好地了解连续变量和串联变量。

# Import Data

df = pd.read_csv("https://github.com/selva86/datasets/raw/master/mpg_ggplot2.csv")


# Prepare data

x_var = 'displ'

groupby_var = 'class'

df_agg = df.loc[:, [x_var, groupby_var]].groupby(groupby_var)

vals = [df[x_var].values.tolist() for i, df in df_agg]


# Draw

plt.figure(figsize=(16,9), dpi= 80)

colors = [plt.cm.Spectral(i/float(len(vals)-1)) for i inrange(len(vals))]
n, bins, patches
= plt.hist(vals, 30, stacked=True, density=False, color=colors[:len(vals)])


# Decoration

plt.legend({group:col forgroup, col inzip(np.unique(df[groupby_var]).tolist(), colors[:len(vals)])})
plt.title(f"Stacked Histogram of ${x_var}$ colored by ${groupby_var}$", fontsize=22)
plt.xlabel(x_var)
plt.ylabel("Frequency")
plt.ylim(0, 25)
plt.xticks(ticks=bins[::3], labels=[round(b,1) for b in bins[::3]])
plt.show()


54.jpg

相关文章
|
2天前
|
数据处理 开发者 Python
Python中的列表推导式:一种优雅的代码简化技巧####
【10月更文挑战第15天】 本文将深入浅出地探讨Python中列表推导式的使用,这是一种强大且简洁的语法结构,用于从现有列表生成新列表。通过具体示例和对比传统循环方法,我们将揭示列表推导式如何提高代码的可读性和执行效率,同时保持语言的简洁性。无论你是Python初学者还是有经验的开发者,掌握这一技能都将使你的编程之旅更加顺畅。 ####
9 1
|
2天前
|
人工智能 IDE 测试技术
使用通义灵码提升Python开发效率:从熟悉代码到实现需求的全流程体验
作为一名Python开发者,我最近开始使用通义灵码作为开发辅助工具。它显著提高了我的工作效率,特别是在理解和修改复杂代码逻辑方面。通过AI编码助手,我能够在短时间内快速上手新项目,实现新需求,并进行代码优化,整体效率提升了60%以上。通义灵码不仅加快了代码生成速度,还增强了代码的健壮性和稳定性。
|
4天前
|
缓存 程序员 开发者
探索Python中的装饰器:一种优雅的代码增强技巧
【10月更文挑战第13天】 在本文中,我们将深入探讨Python中的装饰器,这是一种强大的工具,它允许程序员以简洁而高效的方式扩展或修改函数和类的行为。通过具体示例,我们将展示如何利用装饰器来优化代码结构,提高开发效率,并实现如日志记录、性能计时等常见功能。本文旨在为读者提供一个关于Python装饰器的全面理解,从而能够在他们的项目中灵活运用这一技术。
14 1
|
8天前
|
设计模式 开发者 Python
Python中的装饰器:简化代码与增强功能
【10月更文挑战第9天】在编程的世界里,效率和可读性是衡量代码质量的两大关键指标。Python语言以其简洁明了的语法赢得了无数开发者的青睐,而装饰器则是其独特魅力之一。本文将深入探讨装饰器的工作原理、使用方法以及如何通过自定义装饰器来提升代码的重用性和可维护性,让读者能够更加高效地编写出既优雅又功能强大的代码。
|
9天前
|
缓存 Python
探索Python中的装饰器:简化你的代码之道
【10月更文挑战第8天】在Python的世界里,装饰器就像是一把瑞士军刀,小巧却功能强大。它们能够优雅地修改函数的行为,让代码更加简洁而不失强大。本文将带你走进装饰器的奇妙世界,从基础概念到实战应用,一步步解锁装饰器的秘密,让你的Python代码更上一层楼。
|
8天前
|
设计模式 存储 缓存
Python中的装饰器:提高代码可读性和复用性
【10月更文挑战第9天】Python中的装饰器:提高代码可读性和复用性
12 1
|
8天前
|
IDE 网络安全 开发工具
IDE之pycharm:专业版本连接远程服务器代码,并配置远程python环境解释器(亲测OK)。
本文介绍了如何在PyCharm专业版中连接远程服务器并配置远程Python环境解释器,以便在服务器上运行代码。
56 0
IDE之pycharm:专业版本连接远程服务器代码,并配置远程python环境解释器(亲测OK)。
|
9天前
|
设计模式 测试技术 开发者
Python中的装饰器:提升代码复用与模块化的艺术
本文将带你领略Python装饰器的魔力,探索如何通过装饰器来增强函数功能而不修改其代码。我们将从装饰器的基础概念出发,逐步深入到如何在实际项目中应用装饰器,以及如何编写自定义装饰器。文章最后,我们将通过一个实例,展示装饰器在日志记录和性能测试中的应用,让你的代码更加模块化和可重用。
|
9天前
|
Python
Python实用记录(十一):出现科学计数法如何在代码中恢复
本文介绍了如何在Python中处理科学计数法,包括如何将科学计数法转换为普通数字,以及如何设置NumPy的print选项来避免科学计数法的显示。
31 1
|
10天前
|
开发者 Python
探索Python中的列表推导式:简化代码的利器
在Python编程中,列表推导式是一种简洁而强大的工具,它允许开发者以一行代码实现复杂的列表操作。本文将深入探讨列表推导式的语法、优势以及实际应用,帮助读者更好地利用这一特性来优化代码。