1.ndarray简介
numpy中的ndarray为多维数组,是numpy中最为重要也是python进行科学计算非常重要和基本的数据类型。numpy中基本的运算符进行了重载,算数运算符和逻辑运算符都是逐元素操作的,还有广播机制,使得一个标量与多维数组相互运算的时候也是逐元素运算。
2.axis的理解
有一定python编程基础的人都不难理解多维数组的概念,ndarray最难理解的是axis。ndarray当中的一个元素是通过一系列下标来索引的。
例如a[0][2][3], 可以把axis看成是存放下标的一个框框(虽然不准确,但是这么理解用起来没有问题),第一个框就是第0个axis, 第二个框就是第1个axis……,在函数调用中,如果参数有axis等于n,就相当于对应的n-1个框中的下标进行变化,其它框中下标不变进行操作。
例如下面的代码:
>>> import numpy as np
>>> a=np.ones((3,4,5))
>>> a.sum(axis=0)
array([[3., 3., 3., 3., 3.],
[3., 3., 3., 3., 3.],
[3., 3., 3., 3., 3.],
[3., 3., 3., 3., 3.]])
>>> a.sum(axis=1)
array([[4., 4., 4., 4., 4.],
[4., 4., 4., 4., 4.],
[4., 4., 4., 4., 4.]])
>>> a.sum(axis=2)
array([[5., 5., 5., 5.],
[5., 5., 5., 5.],
[5., 5., 5., 5.]])
从上面的代码可以看出,对上述三维数组 Tijk(i=0,1,2;j=0,1,2,3;k=0,1,2,3,4,5)进行某个下标的求和就得到了另外一个二维数组,类似于张量的指标缩并。如果axis=0,则 Tjk=∑iTijk ,axis=1,axis=2同理。
3.ndarray的属性
其实只要注意几个最重要的属性就好了。
shape
shape属性是一个元组,表示数组的结构。比如一个二维的4*5数组shape为(4,5),了解shape对broadcasting的理解有帮助。
ndim
数组的维数,int类型
dtype
数组的存放的数据类型
T
得到一个转置的数组
real
得到这个数组的实部,与原来的数组是一个同形数组
imag
得到这个数组的虚部,与原来的数组是一个同形数组
flat
将这个数组展开成一维,得到一个迭代器
4.broadcasting机制
当两个数组发生相互作用的时候,比如相加、相乘之类的,当数组的shape不一致的时候,就会把数组扩展成shape的数组进行逐元素操作,得到新的数组。
broadcasting规则:
1.两个shape当中有一个为1就进行扩展
2.shape中有位置缺失,也可进行扩展
例如:
(4,5,1)shape的数组和(1,5,3)shape数组作用最终得到(4,5,3)shape的数组。
(4,5,1)shape的数组和(4,)的数组作用最终得到(4,5,1)shape的数组
>>> a=np.ones((1,3,2))
>>> a
array([[[1., 1.],
[1., 1.],
[1., 1.]]])
>>> a.shape
(1, 3, 2)
>>> b=np.ones((2,3,1))
>>> b.shape
(2, 3, 1)
>>> a*b
array([[[1., 1.],
[1., 1.],
[1., 1.]],
[[1., 1.],
[1., 1.],
[1., 1.]]])
>>> (a*b).shape
(2, 3, 2)
其实a*b的时候,a被扩展为(2,3,2)shape的数组,a[1][i][j]=a[0][i][j]。b也同理被扩展为(2,3,2)shape的数组,b[i][j][1]=b[i][j][0]。