Python学习笔记之NumPy模块——超详细(安装、数组创建、正态分布、索引和切片、数组的复制、维度修改、拼接、分割...)-2

简介: Python学习笔记之NumPy模块——超详细(安装、数组创建、正态分布、索引和切片、数组的复制、维度修改、拼接、分割...)

Python学习笔记之NumPy模块——超详细(安装、数组创建、正态分布、索引和切片、数组的复制、维度修改、拼接、分割...)-1

https://developer.aliyun.com/article/1537767


1.5 ndarray对象

NumPy最重要的一个特点是其N维数组对象ndarray,它是一系列同类型数据的集合,以0下标为开始进行集合中元素的索引。

ndarray对象是用于存放同类型元素的多维数组。

ndarray中的每个元素在内存中都有相同存储大小的区域。

ndarray内部由以下部分内容组成:


  • 一个指向数据(内存或内存映射文件中的一块数据)的指针。
  • 数据类型或dtype,描述在数组中的固定大小值的格子。
  • 一个表示数组形状(shape)的元组,表示各维度大小的元组。


ndarray对象属性有:

【示例】查看ndarray对象属性

# 创建一维数组
a = np.array([1, 2, 3, 4])
# 创建二维数组
b = np.random.randint(4, 10, size=(2, 3))
# 创建三维数组
c = np.random.randn(2, 3, 4)
# ndim属性
print('ndim:', a.ndim, b.ndim, c.ndim)  # 查看数组的维度,如一维数组的维度为1
# shape属性
print('shape:', a.shape, b.shape, c.shape)  # 表示数组的维度,如b是一个2行3列的二维数组
# dtype属性
print('dtype:', a.dtype, b.dtype, c.dtype)  # 查看数组中元素的数据类型,如a和b是int32,c是float64
# size 元素的总个数
print('size:', a.size, b.size, c.size)  # 查看数组中的元素总个数,如c中三维数组的元素个数为24
# itemsize 每个元素所占的字节
print('itemsize', a.itemsize, b.itemsize, c.itemsize)  # 查看每个元素的字节大小(与数据类型有关),如b中每个元素占4个字节
...

运行结果如下:

ndim: 1 2 3
shape: (4,) (2, 3) (2, 3, 4)
dtype: int32 int32 float64
size: 4 6 24
itemsize 4 4 8


1.5 数组的切片和索引

ndarray对象的内容可以通过索引或切片来访问和修改,与Python中list的切片操作一样。

ndarray数组可以基于0 - n的下标进行索引,并设置star,stop及step参数进行,从原数组中切割出一个新数组。

【示例】一维数组切片和索引的使用

# 创建一维数组
a = np.arange(10)
print(a)
# 索引访问:1.正索引访问,从0开始到当前长度减一
print('正索引为0的元素:', a[0])
print('正索引为5的元素:', a[5])
# 负索引访问,从-1开始
print('最后一个元素:', a[-1])
# 切片操作  [star:stop:step]
print(a[:])  # 从开始到结尾
print(a[3:5])  # 从索引3开始到索引4结束[star:stop)
print(a[1:7:2])  # 从索引1开始到6结束,步长为2
print(a[::-1])  # 反向获取

运行结果如下:

[0 1 2 3 4 5 6 7 8 9]
正索引为0的元素: 0
正索引为5的元素: 5
最后一个元素: 9
[0 1 2 3 4 5 6 7 8 9]
[3 4]
[1 3 5]
[9 8 7 6 5 4 3 2 1 0]

【示例】二维数组切片和索引的使用

# 创建一维数组
x = np.arange(1, 13)
a = x.reshape(4, 3)  # 重新转化形状,把一维数组转化为4行3列的二维数组
# 数组元素
print(a)
print('-'*15)
# 使用索引获取
print(a[2])  # 获取第三行
print(a[1][2])  # 获取第二行,第三列的元素
print('-'*15)
# 切片的使用  [对行进行切片, 对列进行切片]  [star:stop:step, star:stop:step]
print(a[:, :])  # 获取所有行所有列
print(a[:, 1])  # 获取所有行第二列
print(a[:, 0:2])  # 获取所有行第一二列,所有行部分列
print('-'*15)
# 获取部分行所有列与之类似
print(a[::2, :])  # 获取奇数行
print(a[::2, 0:2])  # 获取奇数行,第一二列
# 坐标获取 [行, 列]
print(a[1, 2])  # 获取第二行第三列的元素
# 同时获取不同行不同列,获取第二行第三列和第三行第一列,这是获取的值,可以用创建数组的方式将两个值组成一个数组
print(a[(1, 2), (2, 0)])  # 两个括号的第一个值组成一组,第二个值组成一组即第二行第三列和第三行第一列
# 索引为负数来获取
print('-'*15)
print('获取最后一行')
print(a[-1])
print('行进行倒序')
print(a[::-1])
print('行列都倒序')
print(a[::-1, ::-1])

运行结果如下:

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
---------------
[7 8 9]
6
---------------
[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
[ 2  5  8 11]
[[ 1  2]
 [ 4  5]
 [ 7  8]
 [10 11]]
---------------
[[1 2 3]
 [7 8 9]]
[[1 2]
 [7 8]]
6
[6 7]
---------------
获取最后一行
[10 11 12]
行进行倒序
[[10 11 12]
 [ 7  8  9]
 [ 4  5  6]
 [ 1  2  3]]
行列都倒序
[[12 11 10]
 [ 9  8  7]
 [ 6  5  4]
 [ 3  2  1]]

1.6 NumPy中的浅拷贝与深拷贝

1.6.1 浅拷贝

共享内存地址的两个变量,当其中一个变量的值改变时,另一个变量的值也随之改变。此时,变量间的“拷贝”是“浅拷贝”

共享“视图”(view)的两个变量,当其中一个变量的值改变时,另一个变量的值也随之改变。

【示例】浅拷贝

a = np.array([1, 2, 3])
b = a
print(b is a)

运行结果如下:

True

原因:两个变量指向同一块内存地址,如下所示:

1.6.2 深拷贝

深拷贝是创建一个全新的对象,包含原始对象中所有属性和值,并且递归地复制所有嵌套的对象,而不仅仅是复制表面层次结构。

【示例】深拷贝

a = np.array([1, 2, 3])
b = a.copy()  # 调用copy方法进行深拷贝
print(b is a)

运行结果如下:

False

原因:两个变量指向两个不同的地址,所以一个变量的改变不会影响另一个变量

如下所示:

总结:我们只要记住在浅拷贝中,原始数组和新的数组共同执行同一块内存;同时在深拷贝中,新的数组是原始数据的单独的拷贝,它指向一块新的内存地址。

1.7 修改数组的维度

处理数组的一项重要工作就是改变数组的维度,包含提高数组的维度和降低数组的维

度,还包括数组的转置。Numpy 提供的大量 API 可以很轻松地完成这些数组的操作。例如,

通过 reshape 方法可以将一维数组变成二维、三维或者多维数组。通过 ravel 方法或 flatten

方法可以将多维数组变成一维数组。改变数组的维度还可以直接设置 Numpy 数组的 shape

属性(元组类型),通过 resize 方法也可以改变数组的维度。


1. 使用 reshape 将一维数组变成多维维数组

【示例】

# 创建一维数组
x = np.arange(1, 25)
a = x.reshape(2, 3, 4)  # 转化成两个三行四列的三维数组
print(a)

运行结果如下:

[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]
 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]]

注意:转化维度之前要确保转化后的数组与原数组元素个数相统一,否则无法转化。

【示例】将多维数组转化为一维数组

a = np.array([[[1, 2, 3], [4, 5, 6], [7, 8, 9]]])  # 创建三维数组
b = a.reshape(9)  # 括号中填入多维数组的元素个数
c = a.reshape(-1)  # 不管几维数组,有多少元素,都会转化为一维数组
print(b)
print(c)

运行结果如下:

[1 2 3 4 5 6 7 8 9]
[1 2 3 4 5 6 7 8 9]

2. 使用 ravel 函数将多维数组变成一维的数组

ravel()是NumPy中的一个函数,它用于将数组展平成一维数组。返回一个视图(view)或复制(copy),具体取决于原始数组的数据类型和内存布局。

当使用ravel()函数时,如果原始数组是C语言风格的连续数组,则返回一个视图;否则,它将返回一个复制。使用视图,任何对展平后的数组的修改都将反映在原始数组中;而使用复制,则不会影响原始数组。

【示例】使用ravel函数将多维数组转化为一维数组

a = np.array([[1, 2, 3], [4, 5, 6]])  # 创建一个二维数组
b = a.ravel()  # 使用ravel()将数组展平成一维数组
print(b)

运行结果如下:

[1 2 3 4 5 6]

3. 使用 flatten函数将多维数组变成一维的数组

flatten()是NumPy数组对象的一个方法,用于将多维数组展平成一维数组。

与ravel()方法不同,flatten()方法总是返回数组的复制,而不是返回视图。这意味着展平后的数组是原始数组的副本,对展平后的数组的任何修改都不会影响原始数组。

【示例】使用 flatten函数将多维数组转化为一维数组

a = np.array([[1, 2, 3], [4, 5, 6]])  # 创建一个二维数组
b = a.flatten()  # 使用flatten()将数组展平成一维数组
print(b)

运行结果如下:

[1 2 3 4 5 6]

注意:使用flatten()方法返回的是一个新的一维数组,原始数组保持不变。

1.8 数组的拼接

1.8.1 水平数组组合

通过 hstack 函数可以将两个或多个数组水平组合起来形成一个数组,那么什么叫做数组

的水平组合。现在有两个 2*3 的数组 A 和 B。

可以看到,数组 A 和数组 B 在水平方向首尾连接了起来,形成了一个新的数组。这就是数组的水平组合。多个数组进行水平组合的效果类似。但数组水平组合必须要满足一个条件,就是所有参与水平组合的数组的行数必须相同,否则进行水平组合会抛出异常。


1.8.2 垂直数组组合

通过 vstack 函数可以将两个或多个数组垂直组合起来形成一个数组,那么什么叫数组的

垂直组合呢?现在以两个 2*3 的数组 A 和 B 为例

6107ce7a005d3c1501dfcb85fb114ef4_fffe6ece6b7545048d87254cdf110b67.png

numpy.concatenate 函数用于沿指定轴连接相同形状的两个或多个数组,格式如下:

numpy.concatenate((a1, a2, ...), axis)

【示例1】

a = np.array([[1, 2, 3], [4, 5, 6]])
print(a)
b = np.array([['a', 'b', 'c'], ['d', 'e', 'f']])
print(b)
print(np.concatenate([a, b]))
print('垂直方向拼接 相当于 vstack')
print(np.concatenate([a, b], axis=0))
print('水平方向拼接 相当于 hstack')
print(np.concatenate([a, b], axis=1))

运行结果如下:

[[1 2 3]
 [4 5 6]]
[['a' 'b' 'c']
 ['d' 'e' 'f']]
[['1' '2' '3']
 ['4' '5' '6']
 ['a' 'b' 'c']
 ['d' 'e' 'f']]
垂直方向拼接 相当于 vstack
[['1' '2' '3']
 ['4' '5' '6']
 ['a' 'b' 'c']
 ['d' 'e' 'f']]
水平方向拼接 相当于 hstack
[['1' '2' '3' 'a' 'b' 'c']
 ['4' '5' '6' 'd' 'e' 'f']]

numpy.hstack 它通过水平堆叠来生成数组。

numpy.vstack 它通过垂直堆叠来生成数组。

【示例2】vstack 与 hstack

a = np.array([[1, 2, 3], [4, 5, 6]])
b = np.array([['a', 'b', 'c'], ['d', 'e', 'f']])
print('x 轴方向及垂直堆叠')
print(np.vstack([a, b]))
print('y 轴方向及水平堆叠')
print(np.hstack([a, b]))

运行结果如下:

x 轴方向及垂直堆叠
[['1' '2' '3']
 ['4' '5' '6']
 ['a' 'b' 'c']
 ['d' 'e' 'f']]
y 轴方向及水平堆叠
[['1' '2' '3' 'a' 'b' 'c']
 ['4' '5' '6' 'd' 'e' 'f']]

注意:如果拼接的行和列数目不同,则会报错。

【示例3】三维数组的拼接

aa = np.arange(1, 37).reshape(3, 4, 3)
print(aa)
bb = np.arange(101, 137).reshape(3, 4, 3)
print(bb)
print('axis=0' * 10)
print(np.concatenate((aa, bb), axis=0))  # 6,4,3
print('axis=1' * 10)
print(np.concatenate((aa, bb), axis=1))  # 3,8,3
print('axis=2' * 10)
print(np.concatenate((aa, bb), axis=2))  # 3,4,6

axis=0 可以使用 vstack 替换

axis=1 可以使用 hstack 替换

axis=2 可以使用 dstack 替换


1.9 数组的分隔

numpy.split 函数沿特定的轴将数组分割为子数组,格式如下:

numpy.split(ary, indices_or_sections, axis)

fd36a03e89a2087ce0af128969aadaed_1c81102d2ca143dead2880105981fa18.png

1. 水平分隔

分隔数组是组合数组的逆过程,与组合数组一样,分隔数组也分为水平分隔数组和垂直分隔数组。水平分隔数组与水平组合数组对应。水平组合数组是将两个或多个数组水平进行收尾相接,而水平分隔数组是将已经水平组合到一起的数组再分开。

使用 hsplit 函数可以水平分隔数组,该函数有两个参数,第 1 个参数表示待分隔的数组,第 2 个参数表示要将数组水平分隔成几个小数组,现在先来看一个例子。下面是一个 2*6的二维数组

534be92c0bfee2a95e11991a5f317499_4734754ef4f348aa9eb6a500db85d463.png

很明显,将数组 X 分隔成了列数相同的两个数组。现在使用下面的代码重新对数组 X 进行分隔。

6a0f1827f4d37e5f42b3bff2d7e16d24_29404d93a5c241eaa8f1673bd3f6b8e1.png

现在讲数组 X 分隔成了 3 个列数都为 2 的数组,但要是使用 hsplit(X,4)分隔数组 X 就会抛出异常,这是因为数组 X 是没有办法被分隔成列数相同的 4 个数组的,所以使用 hsplit函数分隔数组的一个规则就是第 2 个参数值必须可以整除待分隔数组的列数。

【示例】hsplit

grid=np.arange(16).reshape(4,4)
a,b=np.hsplit(grid,2)
print(a)
print(b)

运行结果如下:

[[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
[[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]
2. 垂直分隔数组

垂直分隔数组是垂直组合数组的逆过程。垂直组合数组是将两个或多个数组垂直进行首尾相接,而垂直分隔数组是将已经垂直组合到一起的数组再分开。

【示例】vsplit

grid=np.arange(16).reshape(4,4)
a,b=np.vsplit(grid,[3])
print(a)
print(b)
print('-'*10)
a,b,c=np.vsplit(grid,[1,3])
print(a)
print(b)
print(c)

运行结果如下:

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[[12 13 14 15]]
----------
[[0 1 2 3]]
[[ 4  5  6  7]
 [ 8  9 10 11]]
[[12 13 14 15]]

【示例】split 分隔数组

# 分隔一维数组
x = np.arange(1, 9)
a = np.split(x, 4)
print(a)
print(a[0])
print(a[1])
print(a[2])
print(a[3])
# 分隔二维数组
a = np.array([[1, 2, 3], [4, 5, 6], [11, 12, 13], [14, 15, 16]])
print('axis=0 垂直方向 平均分隔')
r = np.split(a, 2, axis=0)
print(r[0])
print(r[1])
print('axis=1 水平方向 按位置分隔')
r = np.split(a, [2], axis=1)
print(r)

运行结果如下:

[array([1, 2]), array([3, 4]), array([5, 6]), array([7, 8])]
[1 2]
[3 4]
[5 6]
[7 8]
axis=0 垂直方向 平均分隔
[[1 2 3]
 [4 5 6]]
[[11 12 13]
 [14 15 16]]
axis=1 水平方向 按位置分隔
[array([[ 1,  2],
       [ 4,  5],
       [11, 12],
       [14, 15]]), array([[ 3],
       [ 6],
       [13],
       [16]])]

以上就是全部啦,如有错误或不解之处,请及时私信博主!

相关文章
|
1月前
|
存储 数据处理 Python
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第27天】在科学计算和数据分析领域,Python凭借简洁的语法和强大的库支持广受欢迎。NumPy和SciPy作为Python科学计算的两大基石,提供了高效的数据处理和分析工具。NumPy的核心功能是N维数组对象(ndarray),支持高效的大型数据集操作;SciPy则在此基础上提供了线性代数、信号处理、优化和统计分析等多种科学计算工具。结合使用NumPy和SciPy,可以显著提升数据处理和分析的效率,使Python成为科学计算和数据分析的首选语言。
42 3
|
1月前
|
存储 机器学习/深度学习 算法
Python科学计算:NumPy与SciPy的高效数据处理与分析
【10月更文挑战第26天】NumPy和SciPy是Python科学计算领域的两大核心库。NumPy提供高效的多维数组对象和丰富的数学函数,而SciPy则在此基础上提供了更多高级的科学计算功能,如数值积分、优化和统计等。两者结合使Python在科学计算中具有极高的效率和广泛的应用。
59 2
|
28天前
|
数据采集 存储 分布式计算
超酷炫Python技术:交通数据的多维度分析
超酷炫Python技术:交通数据的多维度分析
|
2月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧2
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
90 10
|
2月前
|
Python
Numpy学习笔记(四):如何将数组升维、降维和去重
本文介绍了如何使用NumPy库对数组进行升维、降维和去重操作。
50 1
|
2月前
|
Python
Numpy学习笔记(五):np.concatenate函数和np.append函数用于数组拼接
NumPy库中的`np.concatenate`和`np.append`函数,它们分别用于沿指定轴拼接多个数组以及在指定轴上追加数组元素。
45 0
Numpy学习笔记(五):np.concatenate函数和np.append函数用于数组拼接
|
2月前
|
Python
使用 NumPy 进行数组操作的示例
使用 NumPy 进行数组操作的示例
38 2
|
2月前
|
索引 Python
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧1
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
111 4
|
7月前
|
Python
python相关库的安装:pandas,numpy,matplotlib,statsmodels
python相关库的安装:pandas,numpy,matplotlib,statsmodels
225 0
|
Python Windows
python怎么安装第三方库,python国内镜像源,终于找到最全的安装教程啦;如Requests,Scrapy,NumPy,matplotlib,Pygame,Pyglet,Tkinter
python怎么安装第三方库,python国内镜像源,终于找到最全的安装教程啦;如Requests,Scrapy,NumPy,matplotlib,Pygame,Pyglet,Tkinter
1432 0