Python 可视化 | 关联图 - 散点图1

简介: Python 可视化 | 关联图 - 散点图1

什么是关联图?

关联图是查找两个事物之间关系的图像,他能为我们展示出一个事物随着另一个事物的变化如何变化。

典型的关联图有:折线图、散点图、相关矩阵等

我们什么时候会需要关联图?

1、数据报告 & 学术研究

展示趋势:比如产品销量随着时间如何变化,智力水平随着教育程度如何变化等

展现状态:不同年龄的客户的成交率,不同生产成本对应的生产员工技能要求等

2、数据探索 & 数据解读

探索数据关系,帮助了解试试,推动研究

3、统计学 & 机器学习

探索数据关系,指导数据预处理和模型选择

散点图

导入需要库

import numpy as np
import pandas as pd
import matplotlib as mpl

绘制一个简单的散点图

使用pd.scatter函数绘制散点图

简单的散点图示例:

# 定义数据,x1 取随机数
x1 = np.random.randn(10) 
x2 = x1 + x1**2-10
# 定义画布,当只有会这个图的时候,下面这句不是必须存在的
plt.figure(figsize=(8,4))
# 绘制图像
plt.scatter(x1, # 横坐标
            x2, # 纵坐标
            s = 50, # 数据点的尺寸大小
            c = "red", # 数据点的颜色
            label = "red points" # 图例
           )
# 装饰图形
# 显示图例,上面的 plt.scatter 中没有 label 属性的下面这句会出现警告
plt.legend()
# 显示图形
plt.show()

绘制多种图例颜色的散点图(以两种为例)

绘制一下图形需要找到以下三个要素:

1、绘图用的数据,x1,x2

2、标签的列表

3、颜色

图例:

# 生成 10 行,2 列的数据表
x = np.random.randn(10,2)
y = np.array([0,0,1,1,0,1,0,1,0,0])
plt.figure(figsize=(8,4))
colors = ["red","black"] # 确立颜色列表
label是 = ["Zero","One"] # 确立标签的类别列表
# 通过循环遍历 x.shape 将多个列形成的图像叠加在一起
for i in range(x.shape[1]):
  plt.scatter(
  x[y==i,0],
  x[y==i,1],
  c=colors[i],
  label=labels[i]
  )
# 在标签中存在几种类别,我们就需要循环几次,一次画一个颜色的点
plt.legend()
plt.show()

绘制复杂的散点图

自己创造数据过于简单,我们可以使用网上大神的简单数据集学习绘制复杂的散点图。

midwest = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/midwest_filter.csv")
# 过滤标签,去除标签重复像
categories = np.unique(midwest['category']) #去掉所有重复的项
plt.figure(figsize=(16,10))
for i in range(len(categories)):
    plt.scatter(midwest.loc[midwest["category"]==categories[i],"area"]
                ,midwest.loc[midwest["category"]==categories[i],"poptotal"]
                ,s=20
                ,c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1)
                ,label=categories[i]
               )
plt.legend()
plt.show()

以上。

Love & Share

[ 完 ]

相关文章
|
2月前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
204 0
|
13天前
|
数据可视化 编译器 Python
Manim:数学可视化的强大工具 | python小知识
Manim(Manim Community Edition)是由3Blue1Brown的Grant Sanderson开发的数学动画引擎,专为数学和科学可视化设计。它结合了Python的灵活性与LaTeX的精确性,支持多领域的内容展示,能生成清晰、精确的数学动画,广泛应用于教育视频制作。安装简单,入门容易,适合教育工作者和编程爱好者使用。
74 7
|
26天前
|
存储 数据可视化 数据挖掘
使用Python进行数据分析和可视化
本文将引导你理解如何使用Python进行数据分析和可视化。我们将从基础的数据结构开始,逐步深入到数据处理和分析的方法,最后通过实际的代码示例来展示如何创建直观的数据可视化。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和技巧。让我们一起探索数据的世界,发现隐藏在数字背后的故事!
|
29天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第42天】本文将介绍如何使用Python进行数据分析和可视化。我们将从数据导入、清洗、探索性分析、建模预测,以及结果的可视化展示等方面展开讲解。通过这篇文章,你将了解到Python在数据处理和分析中的强大功能,以及如何利用这些工具来提升你的工作效率。
|
1月前
|
数据可视化 搜索推荐 Shell
Python与Plotly:B站每周必看榜单的可视化解决方案
Python与Plotly:B站每周必看榜单的可视化解决方案
|
2月前
|
机器学习/深度学习 数据可视化 Python
Python实用记录(三):通过netron可视化模型
使用Netron工具在Python中可视化神经网络模型,包括安装Netron、创建文件和运行文件的步骤。
47 2
Python实用记录(三):通过netron可视化模型
|
1月前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
|
2月前
|
数据采集 Web App开发 数据可视化
Python爬虫教程:Selenium可视化爬虫的快速入门
Python爬虫教程:Selenium可视化爬虫的快速入门
|
2月前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据处理与可视化——以气温数据分析为例
【10月更文挑战第12天】使用Python进行数据处理与可视化——以气温数据分析为例
326 0
|
2月前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
140 0