【机器学习】文章7-阿里云开发者社区

【机器学习】文章7

2022-08-23 273

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： NumPy（Numerical Python）是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵，比Python自身的嵌套列表（nested list structure)结构要高效的多（该结构也可以用来表示矩阵（matrix）），支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。

①Numpy的简介

NumPy（Numerical Python）是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵，比Python自身的嵌套列表（nested list structure)结构要高效的多（该结构也可以用来表示矩阵（matrix）），支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。

🚩一个用python实现的科学计算，包括：

1、一个强大的N维数组对象Array；

2、比较成熟的（广播）函数库；

3、用于整合C/C++和Fortran代码的工具包；

4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。

NumPy（Numeric Python）提供了许多高级的数值编程工具，如：矩阵数据类型、矢量处理，以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融公司使用，以及核心的科学计算组织如：Lawrence Livermore，NASA用其处理一些本来使用C++，Fortran或Matlab等所做的任务。

②数据类型ndarray

NumPy provides an N-dimensional array type, the ndarray, which describes a collection of “items” of the same type.

NumPy提供了一个N维数组类型ndarray，它描述了相同类型的“items”的集合。

ndarray到底跟原生python列表的区别：

从图中我们可以看出ndarray在存储数据的时候，数据与数据的地址都是连续的，这样就给使得批量操作数组元素时速度更快。

这是因为ndarray中的所有元素的类型都是相同的，而Python列表中的元素类型是任意的，所以ndarray在存储元素时内存可以连续，而python原生list就只能通过寻址方式找到下一个元素，这虽然也导致了在通用性能方面Numpy的ndarray不及Python原生list，但在科学计算中，Numpy的ndarray就可以省掉很多循环语句，代码使用方面比Python原生list简单的多。

numpy内置了并行运算功能，当系统有多个核心时，做某种计算时，numpy会自动做并行计算。

Numpy底层使用C语言编写，数组中直接存储对象，而不是存储对象指针，所以其运算效率远高于纯Python代码。

③Numpy的优势

NumPy 的 ndarray 完全支持面向对象的方法。

例如：

ndarray 是一个类，拥有许多方法和属性。

ndarray 的许多方法是 NumPy 名称空间中的函数镜像，允许程序员按照他们喜欢的范式进行编码。

NumPy 的灵活性允数组方言和 ndarray 类成为 Python 中使用的多维数据交换语言。

④Numpy的数据类型

numpy 支持的数据类型比 Python 内置的类型要多很多，基本上可以和 C 语言的数据类型对应上，其中部分类型对应为 Python 内置的类型。下表列举了常用 NumPy 基本类型。

名称描述

bool_ 布尔型数据类型（True 或者 False）

int_ 默认的整数类型（类似于 C 语言中的 long，int32 或 int64）

intc 与 C 的 int 类型一样，一般是 int32 或 int 64

intp 用于索引的整数类型（类似于 C 的 ssize_t，一般情况下仍然是 int32 或 int64）

int8 字节（-128 to 127）

int16 整数（-32768 to 32767）

int32 整数（-2147483648 to 2147483647）

int64 整数（-9223372036854775808 to 9223372036854775807）

uint8 无符号整数（0 to 255）

uint16 无符号整数（0 to 65535）

uint32 无符号整数（0 to 4294967295）

uint64 无符号整数（0 to 18446744073709551615）

float_ float64 类型的简写

float16 半精度浮点数，包括：1 个符号位，5 个指数位，10 个尾数位

float32 单精度浮点数，包括：1 个符号位，8 个指数位，23 个尾数位

float64 双精度浮点数，包括：1 个符号位，11 个指数位，52 个尾数位

complex_ complex128 类型的简写，即 128 位复数

complex64 复数，表示双 32 位浮点数（实数部分和虚数部分）

complex128 复数，表示双 64 位浮点数（实数部分和虚数部分）

numpy 的数值类型实际上是 dtype 对象的实例，并对应唯一的字符，包括 np.bool_，np.int32，np.float32，等等。

⑤Numpy的数组属性

NumPy 数组的维数称为秩（rank），秩就是轴的数量，即数组的维度，一维数组的秩为 1，二维数组的秩为 2，以此类推。

在 NumPy中，每一个线性的数组称为是一个轴（axis），也就是维度（dimensions）。比如说，二维数组相当于是两个一维数组，其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是 NumPy 中的轴（axis），第一个轴相当于是底层数组，第二个轴是底层数组里的数组。而轴的数量——秩，就是数组的维数。 [3]

很多时候可以声明 axis。axis=0，表示沿着第 0 轴进行操作，即对每一列进行操作；axis=1，表示沿着第1轴进行操作，即对每一行进行操作。

NumPy 的数组中比较重要 ndarray 对象属性有：

属性说明

ndarray.ndim 秩，即轴的数量或维度的数量

ndarray.shape 数组的维度，对于矩阵，n 行 m 列

ndarray.size 数组元素的总个数，相当于 .shape 中 n*m 的值

ndarray.dtype ndarray 对象的元素类型

ndarray.itemsize ndarray 对象中每个元素的大小，以字节为单位

ndarray.flags ndarray 对象的内存信息

ndarray.real ndarray元素的实部

ndarray.imag ndarray 元素的虚部

ndarray.data 包含实际数组元素的缓冲区，由于一般通过数组的索引获取元素，所以通常不需要使用这个属性。

【机器学习】文章7

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【机器学习】文章7

热门文章

最新文章

相关电子书