Python 可视化 | 关联图 - 散点图1

简介: Python 可视化 | 关联图 - 散点图1

什么是关联图?

关联图是查找两个事物之间关系的图像,他能为我们展示出一个事物随着另一个事物的变化如何变化。

典型的关联图有:折线图、散点图、相关矩阵等

我们什么时候会需要关联图?

1、数据报告 & 学术研究

展示趋势:比如产品销量随着时间如何变化,智力水平随着教育程度如何变化等

展现状态:不同年龄的客户的成交率,不同生产成本对应的生产员工技能要求等

2、数据探索 & 数据解读

探索数据关系,帮助了解试试,推动研究

3、统计学 & 机器学习

探索数据关系,指导数据预处理和模型选择

散点图

导入需要库

import numpy as np
import pandas as pd
import matplotlib as mpl

绘制一个简单的散点图

使用pd.scatter函数绘制散点图

简单的散点图示例:

# 定义数据,x1 取随机数
x1 = np.random.randn(10) 
x2 = x1 + x1**2-10
# 定义画布,当只有会这个图的时候,下面这句不是必须存在的
plt.figure(figsize=(8,4))
# 绘制图像
plt.scatter(x1, # 横坐标
            x2, # 纵坐标
            s = 50, # 数据点的尺寸大小
            c = "red", # 数据点的颜色
            label = "red points" # 图例
           )
# 装饰图形
# 显示图例,上面的 plt.scatter 中没有 label 属性的下面这句会出现警告
plt.legend()
# 显示图形
plt.show()

绘制多种图例颜色的散点图(以两种为例)

绘制一下图形需要找到以下三个要素:

1、绘图用的数据,x1,x2

2、标签的列表

3、颜色

图例:

# 生成 10 行,2 列的数据表
x = np.random.randn(10,2)
y = np.array([0,0,1,1,0,1,0,1,0,0])
plt.figure(figsize=(8,4))
colors = ["red","black"] # 确立颜色列表
label是 = ["Zero","One"] # 确立标签的类别列表
# 通过循环遍历 x.shape 将多个列形成的图像叠加在一起
for i in range(x.shape[1]):
  plt.scatter(
  x[y==i,0],
  x[y==i,1],
  c=colors[i],
  label=labels[i]
  )
# 在标签中存在几种类别,我们就需要循环几次,一次画一个颜色的点
plt.legend()
plt.show()

绘制复杂的散点图

自己创造数据过于简单,我们可以使用网上大神的简单数据集学习绘制复杂的散点图。

midwest = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/midwest_filter.csv")
# 过滤标签,去除标签重复像
categories = np.unique(midwest['category']) #去掉所有重复的项
plt.figure(figsize=(16,10))
for i in range(len(categories)):
    plt.scatter(midwest.loc[midwest["category"]==categories[i],"area"]
                ,midwest.loc[midwest["category"]==categories[i],"poptotal"]
                ,s=20
                ,c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1)
                ,label=categories[i]
               )
plt.legend()
plt.show()

以上。

Love & Share

[ 完 ]

相关文章
|
1月前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
91 0
|
1月前
|
机器学习/深度学习 数据可视化 Python
Python实用记录(三):通过netron可视化模型
使用Netron工具在Python中可视化神经网络模型,包括安装Netron、创建文件和运行文件的步骤。
29 2
Python实用记录(三):通过netron可视化模型
|
7天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
|
1月前
|
数据采集 Web App开发 数据可视化
Python爬虫教程:Selenium可视化爬虫的快速入门
Python爬虫教程:Selenium可视化爬虫的快速入门
|
2月前
|
数据可视化 Python
Python数据可视化-动态柱状图可视化
Python数据可视化-动态柱状图可视化
|
2月前
|
JSON 数据可视化 数据处理
Python数据可视化-折线图可视化
Python数据可视化-折线图可视化
|
28天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据处理与可视化——以气温数据分析为例
【10月更文挑战第12天】使用Python进行数据处理与可视化——以气温数据分析为例
168 0
|
1月前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
83 0
|
2月前
|
数据采集 传感器 数据可视化
利用Python进行数据分析与可视化
【9月更文挑战第11天】在数字化时代,数据已成为企业决策和科学研究的关键。本文将引导读者了解如何使用Python这一强大的工具进行数据分析和可视化,帮助初学者理解数据处理的流程,并掌握基本的可视化技术。通过实际案例,我们将展示如何从原始数据中提取信息,进行清洗、处理,最终以图形方式展现结果,使复杂的数据变得直观易懂。
|
1月前
|
数据可视化 Python
Python 高级绘图:从基础到进阶的可视化实践
本文介绍了使用 Python 的强大绘图库 matplotlib 实现多种图表绘制的方法,包括简单的折线图、多条折线图、柱状图、饼图、散点图及 3D 图的绘制。通过具体代码示例展示了如何设置轴标签、标题、图例等元素,并指出了 matplotlib 支持更多高级绘图功能。来源:https://www.wodianping.com/app/2024-10/47112.html。
76 0