Python 可视化 | 关联图 - 散点图1

简介: Python 可视化 | 关联图 - 散点图1

什么是关联图?

关联图是查找两个事物之间关系的图像,他能为我们展示出一个事物随着另一个事物的变化如何变化。

典型的关联图有:折线图、散点图、相关矩阵等

我们什么时候会需要关联图?

1、数据报告 & 学术研究

展示趋势:比如产品销量随着时间如何变化,智力水平随着教育程度如何变化等

展现状态:不同年龄的客户的成交率,不同生产成本对应的生产员工技能要求等

2、数据探索 & 数据解读

探索数据关系,帮助了解试试,推动研究

3、统计学 & 机器学习

探索数据关系,指导数据预处理和模型选择

散点图

导入需要库

import numpy as np
import pandas as pd
import matplotlib as mpl

绘制一个简单的散点图

使用pd.scatter函数绘制散点图

简单的散点图示例:

# 定义数据,x1 取随机数
x1 = np.random.randn(10) 
x2 = x1 + x1**2-10
# 定义画布,当只有会这个图的时候,下面这句不是必须存在的
plt.figure(figsize=(8,4))
# 绘制图像
plt.scatter(x1, # 横坐标
            x2, # 纵坐标
            s = 50, # 数据点的尺寸大小
            c = "red", # 数据点的颜色
            label = "red points" # 图例
           )
# 装饰图形
# 显示图例,上面的 plt.scatter 中没有 label 属性的下面这句会出现警告
plt.legend()
# 显示图形
plt.show()

绘制多种图例颜色的散点图(以两种为例)

绘制一下图形需要找到以下三个要素:

1、绘图用的数据,x1,x2

2、标签的列表

3、颜色

图例:

# 生成 10 行,2 列的数据表
x = np.random.randn(10,2)
y = np.array([0,0,1,1,0,1,0,1,0,0])
plt.figure(figsize=(8,4))
colors = ["red","black"] # 确立颜色列表
label是 = ["Zero","One"] # 确立标签的类别列表
# 通过循环遍历 x.shape 将多个列形成的图像叠加在一起
for i in range(x.shape[1]):
  plt.scatter(
  x[y==i,0],
  x[y==i,1],
  c=colors[i],
  label=labels[i]
  )
# 在标签中存在几种类别,我们就需要循环几次,一次画一个颜色的点
plt.legend()
plt.show()

绘制复杂的散点图

自己创造数据过于简单,我们可以使用网上大神的简单数据集学习绘制复杂的散点图。

midwest = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/midwest_filter.csv")
# 过滤标签,去除标签重复像
categories = np.unique(midwest['category']) #去掉所有重复的项
plt.figure(figsize=(16,10))
for i in range(len(categories)):
    plt.scatter(midwest.loc[midwest["category"]==categories[i],"area"]
                ,midwest.loc[midwest["category"]==categories[i],"poptotal"]
                ,s=20
                ,c=np.array(plt.cm.tab10(i/len(categories))).reshape(1,-1)
                ,label=categories[i]
               )
plt.legend()
plt.show()

以上。

Love & Share

[ 完 ]

相关文章
|
8月前
|
数据可视化 搜索推荐 大数据
基于python大数据的北京旅游可视化及分析系统
本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。
|
10月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
1172 0
|
10月前
|
存储 数据可视化 BI
Python可视化应用——学生成绩分布柱状图展示
本程序使用Python读取Excel中的学生成绩数据,统计各分数段人数,并通过Matplotlib库绘制柱状图展示成绩分布。同时计算最高分、最低分及平均分,实现成绩可视化分析。
797 0
|
8月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
8月前
|
机器学习/深度学习 搜索推荐 数据可视化
基于python大数据的音乐可视化与推荐系统
本研究基于Python实现音乐数据采集、清洗、分析与可视化,并结合协同过滤算法构建个性化推荐系统。通过Echarts展示音乐热度及用户偏好,提升用户体验,助力音乐产业智能化发展。
|
8月前
|
搜索推荐 算法 大数据
基于python大数据的旅游景点可视化与推荐系统
本系统基于大数据与网络技术,构建个性化旅游推荐平台。通过收集用户偏好及行为数据,结合机器学习算法,提供精准的旅游目的地、住宿及交通推荐,旨在优化旅游信息传递,提升用户决策效率与旅行体验。
|
9月前
|
数据采集 数据可视化 API
驱动业务决策:基于Python的App用户行为分析与可视化方案
驱动业务决策:基于Python的App用户行为分析与可视化方案
|
10月前
|
存储 数据采集 数据可视化
Python自动化分析知网文献:爬取、存储与可视化
Python自动化分析知网文献:爬取、存储与可视化

推荐镜像

更多