Python|NumPy的常用操作

简介: Python|NumPy的常用操作

什么要用Numpy

Python中常用的基本数据结构有很多,通常我们在进行简单的数值存储的时候都会使用list来进行,但是list的缺点在于对于每一个元素都需要有指针和对象,对于数值运算来说,list显然是比较浪费内存和CPU计算时间的。为了弥补这种结构的不足,Numpy诞生了,在Numpy中提供了两种基本的对象:ndarray和ufunc。ndarray是存储单一数据类型的多维数组,ufunc则是能够对数组进行处理的函数。


Numpy的主要特点

具有运算快,节约空间的ndarray,提供数组化的算数运算和高级的广播功能;

使用标准数学函数对整个数组的数据进行快速运算,不需传统的循环编写;

读取/写入磁盘上的阵列数据和操作存储器映像文件的工具;

线性代数,随机数生成,以及傅立叶变换的能力;


生成ndarray的几种方式

从已有数据中创建

# 将列表转换成ndarray
import numpy as np
list1 = [1.1, 2.2, 3, 4, 5]
nd1 = np.array(list1)
print(type(nd1))
print(list1)
<class 'numpy.ndarray'>
[1.1, 2.2, 3, 4, 5]
# 嵌套列表转换成多维ndarray
list2 = [[1.1, 2.2, 3, 4, 5],[7.7, 8.8, 9, 10, 11]]
nd2 = np.array(list2)
print(type(nd2))
print(list2)
<class 'numpy.ndarray'>
[[1.1, 2.2, 3, 4, 5], [7.7, 8.8, 9, 10, 11]]

利用random模块生成ndarray

在numpy的random模块中提供了多种生成随机数的函数,常用的几种如下:


  • random() 生成0到1之间的随机数;
  • uniform() 生成均匀分布的随机数;
  • randn() 生成标准正态的随机数;
  • normal() 生成符合正态分布的随机数;
  • shuffle() 随机打乱数据的顺序;
  • seed() 设置随机数种子


# 使用random生成随机数
import numpy as np
nd3 = np.random.random((2, 3))
print(type(nd3))
print(nd3)
<class 'numpy.ndarray'>
[[0.56190317 0.17571506 0.73992818]
 [0.61694656 0.84881069 0.47786533]]

创建特殊的多维数组

import numpy as np
# 创建0矩阵
nd4 = np.zeros((3, 3))
# 创建全1矩阵
nd5 = np.ones((3, 3))
# 创建单位矩阵
nd6 = np.eye(3)
nd7 = np.identity(3)
# 创建对角矩阵:主对角线之外的元素都为0
nd8 = np.diag((1, 2, 3, 4))
# 创建对称矩阵
X = np.mat([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
A = np.triu(X)  # 用于提取主对角线元素
nd9 = A + A.T - np.diag((np.diagonal(X)))
print(nd9)
[[1 2 3]
 [2 5 6]
 [3 6 9]]
# np中还提供了函数可以让我们把生成的数据存储成文件,并通过读取的方式加载数据
import numpy as np
nd10 = np.random.random((3, 3))
np.savetxt(X=nd10, fname='./test.txt')
nd11 = np.loadtxt('./test.txt')
print(nd11)
[[0.24245307 0.61346602 0.38558164]
 [0.77844911 0.22011088 0.54350789]
 [0.34898106 0.12912724 0.65936827]]

通过循环的方式创建数组

numpy中提供了arange函数使得我们可以通过循环的方式设置起始位置以及步长来生成数组。

nd12 = np.arange(1, 10, 1)
print(nd12)
[1 2 3 4 5 6 7 8 9]

元素的存取

import numpy as np
# 一维数组的截取
nd13 = np.random.random((10))
# 获取指定位置的数据
nd13[4]
# 获取一段数据
nd13[4:8]
# 根据步长获取数据
nd13[4:8:2]
# 多维数组的截取
nd14 = np.random.random((5, 5))
# 获取指定位置的数据
nd14[2, 4]
# 获取指定区域的数据
nd14[1:4, 1:4]
# 根据数值截取数据
nd14[(nd14 > 0.4) & (nd14 < 0.8)]
# 获取指定的行和列
print(nd14[:, 3])  # 列
print(nd14[3, :])  # 行
[0.8820414  0.63166344 0.88848099 0.91915532 0.38583446]
[0.36635677 0.89179454 0.69437534 0.91915532 0.29375765]

我们除了可以通过指定索引获取数据外,还可以使用choice()函数来随机抽取数据


矩阵的运算

numpy中的linalg模块中提供了很多矩阵运算的函数,主要的函数如下:


  • diag():以一维数组的方式返回方阵的对角线元素
  • dot():矩阵乘法
  • trace():求矩阵的迹(对角线元素的和)
  • det():计算矩阵列式
  • eig():计算方阵的特征值和特征向量
  • inv():计算方阵的逆
  • qr():计算qr分解
  • svd():计算奇异值分解svd
  • solve():解线性方程组Ax=b,其中A为矩阵
  • lstsq():Ax=b的最小二乘法求解


数据的合并与展开

在实际应用中我们经常会遇到需要把数据进行合并和展开的情况,接下来让我们看一下如何进行操作。

一维数组的合并

import numpy as np
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
# 使用append函数进行合并
c = np.append(a, b)
# 使用concatenate函数进行合并
d = np.concatenate((a, b))
print(c)
print(d)
[1 2 3 4 5 6]
[1 2 3 4 5 6]

多维数组的合并

import numpy as np
a = np.arange(4).reshape(2, 2)
b = np.arange(4).reshape(2, 2)
# 按行合并
c = np.append(a, b, axis=0)
# 按列合并
d = np.append(a, b, axis=1)
print(c)
print(d)
[[0 1]
 [2 3]
 [0 1]
 [2 3]]
[[0 1 0 1]
 [2 3 2 3]]

矩阵展开

import numpy as np
nd = np.arange(6).reshape(2, -1)
# 按照列展开
nd1 = nd.ravel("F")
# 按照行展开
nd2 = nd.ravel()
print(nd1)
print(nd2)
[0 3 1 4 2 5]
[0 1 2 3 4 5]

常用的数学函数

numpy中也提供了大量的数学函数,并且这些函数的运行速度要比math等库中的函数快很多(具体快多少可以自己实践证明一下),常用的数学函数如下:


  • sqrt():计算序列化数据的平方根
  • sin(),cos():三角函数
  • abs():计算序列化数据的绝对值
  • dot():矩阵运算
  • log(),log10(),log2():对数函数
  • exp():指数函数
  • cumsum(),cumproduct():累计求和,求积
  • sum():对一个序列化数据进行求和
  • mean():计算均值
  • median():计算中位数
  • std():计算标准差
  • var():计算方差
  • corrcoef():计算相关系数


广播机制

我们都知道,在进行数学运算的时候,不同形状的矩阵不能进行加减的运算,但是numpy中提供的广播机制让我们能够对不同形状的矩阵进行运算,广播的兼容原则为:


  • 对齐尾部维度
  • shape相等或者其中shape元素中有一个为1


import numpy as np
a = np.arange(10).reshape((5,2))
b = np.arange(2).reshape((1,2))
print(a+b)
[[ 0  2]
 [ 2  4]
 [ 4  6]
 [ 6  8]
 [ 8 10]]


相关文章
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
42 2
|
1月前
|
存储 数据处理 Python
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第27天】在科学计算和数据分析领域,Python凭借简洁的语法和强大的库支持广受欢迎。NumPy和SciPy作为Python科学计算的两大基石,提供了高效的数据处理和分析工具。NumPy的核心功能是N维数组对象(ndarray),支持高效的大型数据集操作;SciPy则在此基础上提供了线性代数、信号处理、优化和统计分析等多种科学计算工具。结合使用NumPy和SciPy,可以显著提升数据处理和分析的效率,使Python成为科学计算和数据分析的首选语言。
44 3
|
1月前
|
数据采集 数据可视化 数据处理
如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`)
本文介绍了如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`),加载历史数据,计算均线和其他技术指标,实现交易逻辑,记录和可视化交易结果。示例代码展示了如何根据均线交叉和价格条件进行开仓、止损和止盈操作。实际应用时需注意数据质量、交易成本和风险管理。
68 5
|
1月前
|
存储 机器学习/深度学习 算法
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第26天】NumPy和SciPy是Python科学计算领域的两大核心库。NumPy提供高效的多维数组对象和丰富的数学函数,而SciPy则在此基础上提供了更多高级的科学计算功能,如数值积分、优化和统计等。两者结合使Python在科学计算中具有极高的效率和广泛的应用。
63 2
|
2月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧2
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
92 10
|
2月前
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
61 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
2月前
|
机器学习/深度学习 算法 数据挖掘
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧1
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
59 5
|
2月前
|
索引 Python
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧1
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
114 4
|
2月前
|
机器学习/深度学习 算法 数据可视化
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧2
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
44 1
|
2月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
47 1