利用Numpy读取iris数据集并进行排序、去重、求统计量等操作实战(附源码)

简介: 利用Numpy读取iris数据集并进行排序、去重、求统计量等操作实战(附源码)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

下面读取iris数据中鸢尾花的萼片、花瓣长度数据,并对其进行排序、去重、并求出和、累计和、均值、标准差、方差、最小值、最大值等操作

1:导入模块

2:获取数据并打印如下

iris_data = []
with open("data//iris.csv") as csvfile:
    # 使用csv.reader读取csvfile中的文件
    csv_reader = csv.reader(csvfile)  
    # 读取第一行每一列的标题
    birth_header = next(csv_reader)  
    # 将csv 文件中的数据保存到birth_data中
    for row in csv_reader:  
        iris_data.append(row)
iris_data

3:数据清理 去掉索引号

iris_list = []
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list

4:数据统计

首先创建数据类型

datatype = np.dtype([("Sepal.Length", np.str_, 40), ("Sepal.Width", np.str_, 40), 
                     ("Petal.Length",np.str_, 40), ("Petal.Width", np.str_, 40),("Species",np.str_, 40)])
print(datatype)

然后创建二维数组

iris_data = np.array(iris_list,dtype = datatype)
iris_data

然后将待处理的数据类型转化为float类型

PetalLength =iris_data["Petal.Length"].astype(float)
PetalLength

接着将数据排序

np.sort(PetalLength)

接着进行数据去重

np.unique(PetalLength)

最后对指定列求和 均值 标准差 方差 最小值以及最大值

sum: 计算数组的和

mean 计算数组均值

std 计算数组标准差

var 计算数组方差

min 计算数组最小值

max 计算数组最大值

argmin 返回数组最小元素的索引

argmax 返回数组最小元素的索引

cumsum 计算所有元素的累计和

cumprod 计算所有元素的累计积

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
5月前
|
Python
NumPy 教程 之 NumPy 统计函数 9
NumPy提供了多种统计函数,如计算数组中的最小值、最大值、百分位数、标准差及方差等。其中,标准差是一种衡量数据平均值分散程度的指标,它是方差的算术平方根。例如,对于数组[1,2,3,4],其标准差可通过计算各值与均值2.5的差的平方的平均数的平方根得出,结果为1.1180339887498949。示例代码如下: ```python import numpy as np print(np.std([1,2,3,4])) ``` 运行输出即为:1.1180339887498949。
142 50
|
5月前
|
Python
NumPy 教程 之 NumPy 统计函数 10
NumPy统计函数,包括查找数组中的最小值、最大值、百分位数、标准差和方差等。方差表示样本值与平均值之差的平方的平均数,而标准差则是方差的平方根。例如,`np.var([1,2,3,4])` 的方差为 1.25。
112 48
|
4月前
|
Python
Numpy学习笔记(四):如何将数组升维、降维和去重
本文介绍了如何使用NumPy库对数组进行升维、降维和去重操作。
96 1
|
4月前
|
机器学习/深度学习 算法 数据挖掘
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧1
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
85 5
|
4月前
|
机器学习/深度学习 算法 数据可视化
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧2
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
58 1
|
5月前
|
机器学习/深度学习 搜索推荐 算法
NumPy 教程 之 NumPy 排序、条件筛选函数 8
NumPy提供了多种排序方法,包括快速排序、归并排序及堆排序,各有不同的速度、最坏情况性能、工作空间和稳定性特点。此外,NumPy还提供了`numpy.extract()`函数,可以根据特定条件从数组中抽取元素。例如,在一个3x3数组中,通过定义条件选择偶数元素,并使用该函数提取这些元素。示例输出为:[0., 2., 4., 6., 8.]。
43 8
|
5月前
|
机器学习/深度学习 搜索推荐 算法
NumPy 教程 之 NumPy 排序、条件筛选函数 2
介绍NumPy` 中的排序方法与条件筛选函数。通过对比快速排序、归并排序及堆排序的速度、最坏情况性能、工作空间需求和稳定性,帮助读者选择合适的排序算法。此外,还深入讲解了 `numpy.argsort()` 的使用方法,并通过具体实例展示了如何利用该函数获取数组值从小到大的索引值,并据此重构原数组,使得其变为有序状态。对于学习 `NumPy` 排序功能来说,本教程提供了清晰且实用的指导。
53 7
|
5月前
|
机器学习/深度学习 搜索推荐 算法
NumPy 教程 之 NumPy 排序、条件筛选函数 5
NumPy中的排序方法及特性对比,包括快速排序、归并排序与堆排序的速度、最坏情况性能、工作空间及稳定性分析。并通过`numpy.argmax()`与`numpy.argmin()`函数演示了如何获取数组中最大值和最小值的索引,涵盖不同轴方向的操作,并提供了具体实例与输出结果,便于理解与实践。
37 5
|
6月前
|
索引 Python
Numpy进阶之排序小技巧
Numpy进阶之排序小技巧
70 7
|
6月前
|
Python
NumPy 教程 之 NumPy 统计函数 4
这段内容介绍了NumPy库中的统计函数,特别是`numpy.percentile()`函数的应用。该函数用于计算数组中的百分位数,即一个值之下所包含的观测值的百分比。通过实例展示了如何使用此函数来计算不同轴上的百分位数,并保持输出的维度不变。
46 5