09 numpy 聚合函数 - 极值,方差,标准差

简介: === 聚合函数定义 ===对一组数据进行操作,如取均值、最大值等scores = np.random.randint(1,9,[2,3])scoresarray([[3, 2, 8],[4, 3, 3]])== 最大值 max ==axis 指定轴:0竖着的计算,1横着的计算print(scores.

=== 聚合函数定义 ===

对一组数据进行操作,如取均值、最大值等

scores = np.random.randint(1,9,[2,3])
scores

array([[3, 2, 8],
[4, 3, 3]])

== 最大值 max ==

axis 指定轴:0竖着的计算,1横着的计算

print(scores.max())
print(np.amax(scores,axis=0))
print(np.amax(scores,axis=1))

8
[4 3 8]
[8 4]

== 最小值 min ==

print(scores.min())
print(np.amin(scores,axis=0))
print(np.amin(scores,axis=1))

2
[3 2 3]
[2 3]

== 平均值 mean ==

print(scores.mean())
print(np.mean(scores,axis=0))
print(np.mean(scores,axis=1))

3.83333333333
[ 3.5 2.5 5.5]
[ 4.33333333 3.33333333]

=== 方差 Variance ===

方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。

img_152de31bb057b2af58a251eec6cf2df9.png
总体方差计算公式

方差:

np.mean((a-a.mean()**2)

variance = np.mean((scores-scores.mean())**2)
variance

3.8055555555555549

=标准差 StandardDeviation=

用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

标准差: np.sqrt(方差)

np.sqrt(variance)

1.9507833184532706

相关文章
|
机器学习/深度学习 存储 Serverless
NumPy 与 Python 内置列表计算标准差的区别
NumPy,是 Numerical Python 的简称,用于高性能科学计算和数据分析的基础包,像数学科学工具(pandas)和框架(Scikit-learn)中都使用到了 NumPy 这个包。
Python, Numpy求 list 数组均值,方差,标准差
Python, Numpy求 list 数组均值,方差,标准差
|
数据挖掘 Python
Python | Numpy:详解计算矩阵的均值和标准差
对于 CRITIC 权重法而言,在标准差一定时,指标间冲突性越小,权重也越小;冲突性越大,权重也越大;另外,当两个指标间的正相关程度越大时,(相关系数越接近1),冲突性越小,这表明这两个指标在评价方案的优劣上反映的信息有较大的相似性。
433 0
Python | Numpy:详解计算矩阵的均值和标准差
|
Python
10 numpy 聚合函数 - where,unique
=== np.where函数 === np.where( 判断条件[布尔类型数组],True使用的值,False使用的值 ) 例1:两组数据,取对应位置较大的值 arr1 = np.
1167 0
|
6月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
159 1
|
7月前
|
机器学习/深度学习 数据处理 计算机视觉
NumPy实践宝典:Python高手教你如何轻松玩转数据处理!
【8月更文挑战第22天】NumPy是Python科学计算的核心库,专长于大型数组与矩阵运算,并提供了丰富的数学函数。首先需安装NumPy (`pip install numpy`)。之后可通过创建数组、索引与切片、执行数学与逻辑运算、变换数组形状及类型、计算统计量和进行矩阵运算等操作来实践学习。NumPy的应用范围广泛,从基础的数据处理到图像处理都能胜任,是数据科学领域的必备工具。
87 0
|
4月前
|
存储 数据处理 Python
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第27天】在科学计算和数据分析领域,Python凭借简洁的语法和强大的库支持广受欢迎。NumPy和SciPy作为Python科学计算的两大基石,提供了高效的数据处理和分析工具。NumPy的核心功能是N维数组对象(ndarray),支持高效的大型数据集操作;SciPy则在此基础上提供了线性代数、信号处理、优化和统计分析等多种科学计算工具。结合使用NumPy和SciPy,可以显著提升数据处理和分析的效率,使Python成为科学计算和数据分析的首选语言。
133 3
|
4月前
|
存储 机器学习/深度学习 算法
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第26天】NumPy和SciPy是Python科学计算领域的两大核心库。NumPy提供高效的多维数组对象和丰富的数学函数,而SciPy则在此基础上提供了更多高级的科学计算功能,如数值积分、优化和统计等。两者结合使Python在科学计算中具有极高的效率和广泛的应用。
146 2
|
6月前
|
机器学习/深度学习 算法 数据可视化
8种数值变量的特征工程技术:利用Sklearn、Numpy和Python将数值转化为预测模型的有效特征
特征工程是机器学习流程中的关键步骤,通过将原始数据转换为更具意义的特征,增强模型对数据关系的理解能力。本文重点介绍处理数值变量的高级特征工程技术,包括归一化、多项式特征、FunctionTransformer、KBinsDiscretizer、对数变换、PowerTransformer、QuantileTransformer和PCA,旨在提升模型性能。这些技术能够揭示数据中的潜在模式、优化变量表示,并应对数据分布和内在特性带来的挑战,从而提高模型的稳健性和泛化能力。每种技术都有其独特优势,适用于不同类型的数据和问题。通过实验和验证选择最适合的变换方法至关重要。
118 5
8种数值变量的特征工程技术:利用Sklearn、Numpy和Python将数值转化为预测模型的有效特征
|
5月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧2
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
185 10