【机器学习】文章8

简介: numpy中的ndarray为多维数组,是numpy中最为重要也是python进行科学计算非常重要和基本的数据类型。numpy中基本的运算符进行了重载,算数运算符和逻辑运算符都是逐元素操作的,还有广播机制,使得一个标量与多维数组相互运算的时候也是逐元素运算。

1.ndarray简介

numpy中的ndarray为多维数组,是numpy中最为重要也是python进行科学计算非常重要和基本的数据类型。numpy中基本的运算符进行了重载,算数运算符和逻辑运算符都是逐元素操作的,还有广播机制,使得一个标量与多维数组相互运算的时候也是逐元素运算。


2.axis的理解

有一定python编程基础的人都不难理解多维数组的概念,ndarray最难理解的是axis。ndarray当中的一个元素是通过一系列下标来索引的。


例如a[0][2][3], 可以把axis看成是存放下标的一个框框(虽然不准确,但是这么理解用起来没有问题),第一个框就是第0个axis, 第二个框就是第1个axis……,在函数调用中,如果参数有axis等于n,就相当于对应的n-1个框中的下标进行变化,其它框中下标不变进行操作。


例如下面的代码:


>>> import numpy as np

>>> a=np.ones((3,4,5))

>>> a.sum(axis=0)

array([[3., 3., 3., 3., 3.],

      [3., 3., 3., 3., 3.],

      [3., 3., 3., 3., 3.],

      [3., 3., 3., 3., 3.]])

>>> a.sum(axis=1)

array([[4., 4., 4., 4., 4.],

      [4., 4., 4., 4., 4.],

      [4., 4., 4., 4., 4.]])

>>> a.sum(axis=2)

array([[5., 5., 5., 5.],

      [5., 5., 5., 5.],

      [5., 5., 5., 5.]])


从上面的代码可以看出,对上述三维数组 Tijk(i=0,1,2;j=0,1,2,3;k=0,1,2,3,4,5)进行某个下标的求和就得到了另外一个二维数组,类似于张量的指标缩并。如果axis=0,则 Tjk=∑iTijk ,axis=1,axis=2同理。


3.ndarray的属性image.png

其实只要注意几个最重要的属性就好了。


shape

shape属性是一个元组,表示数组的结构。比如一个二维的4*5数组shape为(4,5),了解shape对broadcasting的理解有帮助。


ndim

数组的维数,int类型


dtype

数组的存放的数据类型


T

得到一个转置的数组


real

得到这个数组的实部,与原来的数组是一个同形数组


imag

得到这个数组的虚部,与原来的数组是一个同形数组


flat

将这个数组展开成一维,得到一个迭代器


4.broadcasting机制

当两个数组发生相互作用的时候,比如相加、相乘之类的,当数组的shape不一致的时候,就会把数组扩展成shape的数组进行逐元素操作,得到新的数组。


broadcasting规则:


1.两个shape当中有一个为1就进行扩展


2.shape中有位置缺失,也可进行扩展


例如:


(4,5,1)shape的数组和(1,5,3)shape数组作用最终得到(4,5,3)shape的数组。


(4,5,1)shape的数组和(4,)的数组作用最终得到(4,5,1)shape的数组


>>> a=np.ones((1,3,2))

>>> a

array([[[1., 1.],

       [1., 1.],

       [1., 1.]]])

>>> a.shape

(1, 3, 2)

>>> b=np.ones((2,3,1))

>>> b.shape

(2, 3, 1)

>>> a*b

array([[[1., 1.],

       [1., 1.],

       [1., 1.]],

      [[1., 1.],

       [1., 1.],

       [1., 1.]]])

>>> (a*b).shape

(2, 3, 2)


其实a*b的时候,a被扩展为(2,3,2)shape的数组,a[1][i][j]=a[0][i][j]。b也同理被扩展为(2,3,2)shape的数组,b[i][j][1]=b[i][j][0]。


目录
相关文章
|
机器学习/深度学习 资源调度 算法
【机器学习基础】多元线性回归(适合初学者的保姆级文章)
【机器学习基础】多元线性回归(适合初学者的保姆级文章)
440 0
|
机器学习/深度学习 数据采集 人工智能
给爆火的Llama 2划重点,Huggingface机器学习科学家写了篇分析文章
给爆火的Llama 2划重点,Huggingface机器学习科学家写了篇分析文章
241 1
|
存储 机器学习/深度学习 并行计算
【机器学习】文章9
①Numpy的简介 NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 🚩一个用python实现的科学计算,包括: 1、一个强大的N维数组对象Array; 2、比较成熟的(广播)函数库; 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算
104 0
【机器学习】文章9
|
机器学习/深度学习 人工智能 文字识别
开发者玩转机器学习不能错过的15篇深度文章!
机器学习平台PAI是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务。开发者可以通过PAI快速构建训练模型,如搭建一些《物体识别》、《验证语音降噪等》有趣的实验模型,也可以契合企业需求,实现企业个性化推荐,小编整理了一些基于PAI平台的模型开发训练指南,供开发者参考收藏。
|
存储 机器学习/深度学习 并行计算
【机器学习】文章7
NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
137 0
【机器学习】文章7
|
机器学习/深度学习 Kubernetes 算法
【机器学习】文章6(总结)
该算法假定输入的数据矩阵具有隐藏的棋盘结构,因此可以对其中的行和列进行划分,使得行簇和列簇的笛卡尔积中的任何双聚类的条目近似恒定。例如,如果有两个行分区和三个列分区,则每行将属于三个双聚集,而每列将属于两个双聚集。
136 0
【机器学习】文章6(总结)
|
机器学习/深度学习 Kubernetes 算法
【机器学习】文章5
对于一元函数f(xf(x),如果对于任意tϵ[0,1]均满足:f(tx1+(1−t)x2)≤tf(x1)+(1−t)f(x2)f(tx1+(1−t)x2)≤tf(x1)+(1−t)f(x2),则称f(x)f(x)为凸函数。 同时如果对于任意tϵ(0,1))均满足:f(tx1+(1−t)x2)<tf(x1)+(1−t)f(x2)f(tx1+(1−t)x2)<tf(x1)+(1−t)f(x2),则称f(x)f(x)为严格凸函数。
258 0
【机器学习】文章5
|
机器学习/深度学习 算法 搜索推荐
【机器学习】文章4
首先对于 CONVEX BICLUSTERING做一个描述,CONVEX是凸面的,所以我们很容易就知道CONVEX BICLUSTERING是一个凸双聚类。 在双聚群问题中,我们寻求同时对观察结果和特征进行分组,虽然聚簇在从文本挖掘到协同过滤的广泛领域都有应用,但在高维基因组数据中识别结构的问题激发了这项工作。
168 0
【机器学习】文章4
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】文章2
聚类一直是机器学习、数据挖掘、模式识别等领域的重要组成内容。聚类是在无标记样本的条件下将数据分组,他通常被用于以下三个方面: 🌈发现数据的潜在结构 🌈对数据进行自然分组 🌈对数据进行压缩
178 0
【机器学习】文章2
|
机器学习/深度学习
【机器学习】文章1
回归是对一个或多个自变量和因变量之间的关系进行建模,求解的一种统计方法。很多模型都是在他的基础上建立的,任何一个复杂模型,其内部可能会隐藏着许多回归模型。
133 0
【机器学习】文章1