数据可视化 | 20行代码玩转象限图!

简介: Python 的绘图功能非常强大,如果能将已有的绘图库的各种复杂操作汇总在一个自己写的函数甚至是库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更是如虎添翼。今天,我们就来讲讲一学就会的象限图。

image.png

上图学名叫波士顿矩阵分析图,大白话四象限图。这种图经常用于两个维度的散点图中,根据特定的分割线(均值,目标值,实际值等)将数据分为四类,使人一目了然。


常用的场景为分析两个维度的变化比如:比较商品的库存天数和库存周转率,充值人数和每付费用户平均收益,购物篮系数和购物篮数量等


如何使用 Python 画出此图是本文的目标,事不宜迟,赶快开始!


任何复杂的 Python 绘图都不是一蹴而就的,而是先画出基础图形,后在此基础上按需添加元素并优化而成。这里以一组城市经济数据为例来讲解绘图步骤


基础散点图


df = pd.read_csv('data.csv')
df; df.plot(kind='scatter', x='经济总量水平', y='人均水平')


image.png


简洁又朴素的散点图,仅需一行代码。离期望成图还差几步


  • 为每个点添加对应的城市名称
  • 添加特定的分割线(均值,目标值,实际值)
  • 背景添加网格
  • 一些其他的定制需求...


图像优化


image.png


成图如下:


image.png


从上图可以看出:


  • 广西,河北,福建三地的人均水平和经济总量水平都偏低


  • 上海的人均经济水平很高,但经济总量水平缺只是略优于均值


  • 广东的人均经济水平稍次于均值,但经济总量水平很高


  • 等等~


当然,如果我们通过添加数量更多的定制线也可以实现常用的九宫格图


image.png


最后总结一下,Python 的一些绘图方法、参数看似琐碎,但积累到一定程度后,便可以发现许多技巧都存在共通之处。小事情重复做也会成为大麻烦,所以高手都懂得分类处理。


贯通了 3 个核心,我们才能省时省事,成为别人眼中的高手:


  • 大量重复的工作懂得批处理


  • 反复要做的固定操作固化成 " 模板 “,” 套路 "


  • 碰到异常情况,知道如何准确高效的解决。


所以我们可以将四象限图的绘制方法封装成自己的函数以供快捷调用,篇幅原因就不多展示了。


上文核心代码如下:


import matplotlib.pyplot as plt
# 为每个点添加对应的城市名称
plt.figure(figsize=(10, 8))
# 基础散点图:这里需要单独拆开 x,y 轴和希望配对的标签,为下面的轮子做准备
x, y = df['经济总量水平'], df['人均水平']
label = df['area']
plt.scatter(x, y)
plt.xlabel('经济总量水平');
plt.ylabel('人均水平')
# 对散点图中的每一个点进行文字标注
## 固定代码,无需深究,拿来即用
for a,b,l in zip(x,y,label): # zip 拉链函数将其配对组合
    plt.text(a, b+0.1, '%s.' % l, ha='center', va='bottom',                                              
                                              fontsize=14)
                   # 0.1 向上轻微偏移     
# 添加特定分割线
## vlines: vertical 垂直于 x 轴的线,在变量'经济总量'的均值处开始画,   
## y 轴的范围[1.5, 3]
plt.vlines(x=df['经济总量水平'].mean(), ymin=-1.5, ymax=3,
          colors='red', linewidth=2)
plt.hlines(y=df['人均水平'].mean(), xmin=-4, xmax=6,
          colors='red', linewidth=2)
# 背景网格
plt.grid(True)
# 定制需求:隐去四周的边框线条
# sns.despine(trim=True, left=True, bottom=True)
相关文章
|
机器学习/深度学习 算法 测试技术
低照度增强算法(图像增强+目标检测+代码)
低照度增强算法(图像增强+目标检测+代码)
|
SQL 存储 数据库
SQL实践篇(二):为什么微信用SQLite存储聊天记录
SQL实践篇(二):为什么微信用SQLite存储聊天记录
919 1
|
8月前
|
存储 人工智能 自然语言处理
15.4K Star!Vercel官方出品,零基础构建企业级AI聊天机器人
"基于Next.js 14和AI SDK打造的Chat SDK,让开发者快速构建支持多模态交互、代码执行、文件共享的智能对话系统,5分钟完成全栈部署!" —— Vercel AI Chatbot项目核心宣言
494 5
|
5月前
|
SQL 人工智能 数据可视化
开源AI BI可视化工具-WrenAI
Wren AI 是一款开源的 SQL AI 代理,支持数据、产品及业务团队通过聊天、直观界面和与 Excel、Google Sheets 的集成获取洞察。它结合大型语言模型(LLM)与检索增强生成(RAG)技术,助力用户高效处理复杂数据分析任务。
|
机器学习/深度学习 边缘计算 5G
|
Linux
Linux 目录 rc0.d rc1.d rc2.d rc3.d rc4.d rc5.d rc6.d 是干什么的
【5月更文挑战第17天】Linux 目录 rc0.d rc1.d rc2.d rc3.d rc4.d rc5.d rc6.d 是干什么的
780 1
|
存储 传感器 定位技术
Landsat系列卫星遥感影像数据USGS中批量下载多张图像的方法
Landsat系列卫星遥感影像数据USGS中批量下载多张图像的方法
380 1
|
Unix Linux Shell
振南技术干货集:各大平台串口调试软件大赏(3)
振南技术干货集:各大平台串口调试软件大赏(3)
|
算法 安全 C++
C++并发编程中的锁的介绍(一)
C++并发编程中的锁的介绍(一)
450 0
|
应用服务中间件 nginx
Failed:(13: Permission denied)导致访问浏览器出现Nginx 500 Internal Server Error
Failed:(13: Permission denied)导致访问浏览器出现Nginx 500 Internal Server Error
1015 1
Failed:(13: Permission denied)导致访问浏览器出现Nginx 500 Internal Server Error