【Python机器学习】数据可视化讲解及性别、周末与购物间可视化实战(超详细 附源码)

简介: 【Python机器学习】数据可视化讲解及性别、周末与购物间可视化实战(超详细 附源码)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

数据可视化

数据可视化通过直观的方式增加对数据的理解,帮助提取有用特征。

1.特征取值分布

特征的取值分布情况可以为分析特征提供重要信息。一般采用直方图和饼图来可视化取值分布。Python扩展库Matplotlib提供了多种画图方法。

2.离散型特征与离散型标签的关系

样本特征的值与该样本的标签的关系,是机器学习最为关心的事情。通过可视化,可以直观地展现标签值随某特征取值的变化而变化的情况。

3.连续型特征与离散型标签的关系

观察连续型特征与离散型标签的关系,常用盒图(Box plots)。

对于单个变量,盒图描述的是其分布的四分位图:上边缘 上四分位数 中位数 下四分位数和下边缘,上边缘是最大数,上四分位数是由大到小排在四分之一的那个值,中位数是排在中间的那个数,下四分位数是排在四分之三的那个数,下边缘是最小数,单个变量的盒图便于观察变量值的分布中心 扩展和偏移,另外还可以发现离群的异常值的存在

4.离散型特征与连续型标签的关系

密度图(Density plots)也可用来可视化类似关系。 在密度图中,将每个离散的特征值画一条曲线,多条曲线放在一起进行比较,每个离散特征值的曲线的横坐标设为连续的标签值,纵坐标设为对应标签纸的密度

5.连续型特征与连续型标签的关系

连续型特征与连续型标签的关系是常用的画图方式,即将输入、输出值对应在平面上作点,可采用matplotlib和pandas中的scatter()函数。

下面是部分绘图函数与其对应函数方法

可视化性别、周末与购物之间关系

可以采用马赛克图来可视化离散型特征值与离散型标签的关系

下面给出一个简单示例,其中可视化了性别与购物之间关系的可视化,以及周末与购物之间关系的可视化

部分数据如下 性别1男 0女 是否购物 1购物 0不购物

[2020, 11, 1, 1, 1],
               [2020, 11, 1, 0, 1],
               [2020, 11, 1, 0, 1],
               [2020, 11, 1, -1, 1],
               [2020, 11, 1, 1, 1],
               [2020, 11, 1, 0, 1],
               [2020, 11, 1, 0, 0],
               [2020, 11, 1, 0, 1],
               [2020, 11, 2, 1, 0],
               [2020, 11, 2, 1, 1],
              ],
               [2020, 11, 7, 0, 1],
               [2020, 11, 8, 1, 1],
               [2020, 11, 8, 0, 1],
               [2020, 11, 9, 0, 0],
               [2020, , 11, 1, -1],
               [2020, 11, 12, 0, 0]]

性别与购物关系的马赛克图如下

周末与购物之间关系如下

部分代码如下

import datetime # 导入datetime模块,该模块用来处理与日期和时间有关的计算
# 定义一个判断是否为周末的函数
def isweekend( date ): 
    theday = datetime.date( date[0], date[1], date[2] ) # 创建一个date对象
    if theday.isoweekday() in { 6, 7 }: # 如果date是周末则返回1,否则返回0
        return 1
    else:
        return 0
# 是否周末的特征,性别,是否购物三项数据
train_set1 = []
for i in range(len(train_data)):
        weekend = isweekend(train_data[i][:3])
        train_set1.append( [weekend, train_data[i][3], train_data[i][4]] )
wk = df[0].astype('str').apply(lambda x: '周末' if x=='1' else '非周末')
man = df[1].astype('str').apply(lambda x: '男' if x=='1' else '女')
label = df[2].astype('str').apply(lambda x: '购物' if x=='1' else '不购物')
#print(label)
mosaic_data1 = pd.concat([man, label], axis=1)
#print(mosaic_data)
mosaic(data=mosaic_data1, index=[1, 2], gap=0.01, title=u'性别与购物的关系')

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
11天前
|
数据采集 机器学习/深度学习 人工智能
Python编程入门:从基础到实战
【10月更文挑战第36天】本文将带你走进Python的世界,从基础语法出发,逐步深入到实际项目应用。我们将一起探索Python的简洁与强大,通过实例学习如何运用Python解决问题。无论你是编程新手还是希望扩展技能的老手,这篇文章都将为你提供有价值的指导和灵感。让我们一起开启Python编程之旅,用代码书写想法,创造可能。
|
9天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
29 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
11天前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
27 2
|
12天前
|
机器学习/深度学习 数据可视化 数据处理
Python数据科学:从基础到实战
Python数据科学:从基础到实战
22 1
|
8天前
|
数据采集 存储 数据处理
探索Python中的异步编程:从基础到实战
【10月更文挑战第39天】在编程世界中,时间就是效率的代名词。Python的异步编程特性,如同给程序穿上了一双翅膀,让它们在执行任务时飞得更高、更快。本文将带你领略Python异步编程的魅力,从理解其背后的原理到掌握实际应用的技巧,我们不仅会讨论理论基础,还会通过实际代码示例,展示如何利用这些知识来提升你的程序性能。准备好让你的Python代码“起飞”了吗?让我们开始这场异步编程的旅程!
21 0
|
12天前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【Python机器学习】文本特征提取及文本向量化讲解和实战(图文解释 附源码)
【Python机器学习】文本特征提取及文本向量化讲解和实战(图文解释 附源码)
411 0
|
6月前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习】K-Means对文本聚类和半环形数据聚类实战(附源码和数据集)
【Python机器学习】K-Means对文本聚类和半环形数据聚类实战(附源码和数据集)
184 0
|
1月前
|
机器学习/深度学习 算法 数据挖掘
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧1
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
51 5
|
1月前
|
机器学习/深度学习 数据采集 分布式计算
【Python篇】深入机器学习核心:XGBoost 从入门到实战
【Python篇】深入机器学习核心:XGBoost 从入门到实战
99 3

热门文章

最新文章

下一篇
无影云桌面