利用Numpy读取iris数据集并进行排序、去重、求统计量等操作实战(附源码)

简介: 利用Numpy读取iris数据集并进行排序、去重、求统计量等操作实战(附源码)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

下面读取iris数据中鸢尾花的萼片、花瓣长度数据,并对其进行排序、去重、并求出和、累计和、均值、标准差、方差、最小值、最大值等操作

1:导入模块

2:获取数据并打印如下

iris_data = []
with open("data//iris.csv") as csvfile:
    # 使用csv.reader读取csvfile中的文件
    csv_reader = csv.reader(csvfile)  
    # 读取第一行每一列的标题
    birth_header = next(csv_reader)  
    # 将csv 文件中的数据保存到birth_data中
    for row in csv_reader:  
        iris_data.append(row)
iris_data

3:数据清理 去掉索引号

iris_list = []
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list

4:数据统计

首先创建数据类型

datatype = np.dtype([("Sepal.Length", np.str_, 40), ("Sepal.Width", np.str_, 40), 
                     ("Petal.Length",np.str_, 40), ("Petal.Width", np.str_, 40),("Species",np.str_, 40)])
print(datatype)

然后创建二维数组

iris_data = np.array(iris_list,dtype = datatype)
iris_data

然后将待处理的数据类型转化为float类型

PetalLength =iris_data["Petal.Length"].astype(float)
PetalLength

接着将数据排序

np.sort(PetalLength)

接着进行数据去重

np.unique(PetalLength)

最后对指定列求和 均值 标准差 方差 最小值以及最大值

sum: 计算数组的和

mean 计算数组均值

std 计算数组标准差

var 计算数组方差

min 计算数组最小值

max 计算数组最大值

argmin 返回数组最小元素的索引

argmax 返回数组最小元素的索引

cumsum 计算所有元素的累计和

cumprod 计算所有元素的累计积

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
1月前
|
机器学习/深度学习 PyTorch 算法框架/工具
PyTorch基础之张量模块数据类型、基本操作、与Numpy数组的操作详解(附源码 简单全面)
PyTorch基础之张量模块数据类型、基本操作、与Numpy数组的操作详解(附源码 简单全面)
48 0
|
1月前
|
搜索推荐 算法 索引
NumPy三种排序的表现与思考
NumPy排序法自我认为,并不是哪个排序算法速度快,或者稳定性高,就在项目中频繁的进行使用,这个跟我们开发的项目大小和环境也有一定的关系吧,选择合理的排序算法,也是能提高项目性能的。
|
15天前
|
机器学习/深度学习 人工智能 IDE
人工智能平台PAI操作报错合集之交互式建模(DSW)环境中,numpy模块如何正确安装
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
1月前
|
存储 测试技术 程序员
【Python】—— NumPy基础及取值操作
【Python】—— NumPy基础及取值操作
16 1
|
1月前
|
存储 数据挖掘 vr&ar
深入探索Numpy--索引,切片,随机数,文本操作等
深入探索Numpy--索引,切片,随机数,文本操作等
|
1月前
|
搜索推荐 数据挖掘 数据处理
NumPy数组统计与排序方法全览
【4月更文挑战第17天】本文介绍了NumPy在Python中的数组统计和排序功能。主要包括计算平均值、标准差和方差的`np.mean()`, `np.std()`, `np.var()`方法,以及求最大值、最小值、百分位数的功能。在排序方面,讲解了基本排序的`np.sort()`,获取排序索引的`np.argsort()`,逆序排序和随机排序的方法。这些工具对于数据分析和科学计算十分实用,能有效提升数据处理效率。
|
1月前
|
数据采集 机器学习/深度学习 数据挖掘
网络数据处理中的NumPy应用实战
【4月更文挑战第17天】本文介绍了NumPy在网络数据处理中的应用,包括数据预处理、流量分析和模式识别。通过使用NumPy进行数据清洗、格式化和聚合,以及处理时间序列数据和计算统计指标,可以有效进行流量分析和异常检测。此外,NumPy还支持相关性分析、周期性检测和聚类分析,助力模式识别。作为强大的科学计算库,NumPy在处理日益增长的网络数据中发挥着不可或缺的作用。
|
1月前
|
存储 机器学习/深度学习 数据处理
NumPy:从初识到实战,探索Python科学计算的无限可能
NumPy:从初识到实战,探索Python科学计算的无限可能
112 0
NumPy:从初识到实战,探索Python科学计算的无限可能
|
1月前
|
机器学习/深度学习 数据挖掘 Python
NumPy 中级教程——线性代数操作
NumPy 中级教程——线性代数操作
178 4
|
1月前
|
存储 并行计算 数据挖掘
利用Numpy和Pandas对地铁客量数据进行实战分析(附源码)
利用Numpy和Pandas对地铁客量数据进行实战分析(附源码)
75 1