03 机器学习 - Python基础回顾（三）（上）-阿里云开发者社区

03 机器学习 - Python基础回顾（三）（上）

2023-11-03 62

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 03 机器学习 - Python基础回顾（三）（上）

1 什么是Numpy

Numpy是Python的一个科学计算的库

主要提供矩阵运算[考虑是否需要补充讲解最基本的矩阵运算知识]的功能，而矩阵运算在机器学习领域应用非常广泛。

Numpy一般与Scipy、matplotlib一起使用。

虽然python中的list已经提供了类似于矩阵的表示形式，不过Numpy为我们提供了更多的函数。

2 安装导入了Numpy

Mac下安装pip:

sudo easy_install pip

进入Python，通用做法import numpy as np 简单输入

>>> import numpy as np
>>> print np.version.version
1.6.2

PythonCharm 下安装：

首先打开pycharm菜单栏File>>Settings…然后单击Project>>Project Interpreter。输入numpy，下载即可。

3 Numpy组成

Numpy基础部分中，有两个主要内容，如下：

任意维数的数组对象（ndarray，n-dimensional array object）
通用函数对象（ufunc，universal function object）

3.1 多维数组

3.1.1 Numpy中的数组

Numpy中，最重要的数据结构是：多维数组的类型（numpy.ndarray）

ndarray由两部分组成：

实际所持有的数据；
描述这些数据的元数据（metadata）

与Python原生支持的List类型不同，数组的所有元素必须同样的类型。

数组（即矩阵）的维度被称为axes，维数称为 rank 。

ndarray 的重要属性包括:

ndarray.ndim：数组的维数，也称为rank
ndarray.shape：数组各维的大小，对一个n行m列的矩阵来说， shape 为 (n,m)
ndarray.size：元素的总数。
ndarray.dtype：每个元素的类型，可以是numpy.int32, numpy.int16, and numpy.float64等
ndarray.itemsize：每个元素占用的字节数。
ndarray.data：指向数据内存。

3.1.2 ndarray常用方法示例

使用numpy.array方法

以list或tuple变量为参数产生一维数组：

>>> print np.array([1,2,3,4])
[1 2 3 4]
>>> print np.array((1.2,2,3,4))
[ 1.2  2.   3.   4. ]
>>> print type(np.array((1.2,2,3,4)))
<type 'numpy.ndarray'>

以list或tuple变量为元素产生二维数组或者多维数组：

>>> x = np.array(((1,2,3),(4,5,6)))
>>> x
array([[1, 2, 3],
       [4, 5, 6]])
>>> y = np.array([[1,2,3],[4,5,6]])
>>> y
array([[1, 2, 3],
       [4, 5, 6]])
index 和slicing ：第一数值类似数组横坐标，第二个为纵坐标
>>> x[1,2]
6
>>> y=x[:,1]     #取第二列
>>> y
array([2, 5])
涉及改变相关问题，我们改变上面y是否会改变x？这是特别需要关注的！
>>> y[0] = 10
>>> y
array([10,  5])
>>> x
array([[ 1, 10,  3],
     [ 4,  5,  6]])

通过上面可以发现改变y会改变x ，因而我们可以推断，y和x指向是同一块内存空间值，系统没有为y 新开辟空间把x值赋值过去。

使用numpy.arange方法

>>> print np.arange(15)
[ 0  1  2  3  4  5  6  7  8  9  10  11  12  13  14]
>>> print type(np.arange(15))
<type 'numpy.ndarray'>
>>> print np.arange(15).reshape(3,5)
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
>>> print type(np.arange(15).reshape(3,5))
<type 'numpy.ndarray'>

使用numpy.linspace方法

例如，在从1到10中产生20个数：

>>> print np.linspace(1,10,20)
[  1.           1.47368421   1.94736842   2.42105263   2.89473684
   3.36842105   3.84210526   4.31578947   4.78947368   5.26315789
   5.73684211   6.21052632   6.68421053   7.15789474   7.63157895
   8.10526316   8.57894737   9.05263158   9.52631579  10.        ]

使用numpy.zeros，numpy.ones，numpy.eye等方法可以构造特定的矩阵

构造“0”矩阵：

>>> print np.zeros((3,4))
[[ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]]

构造“1”矩阵

>>> print np.ones((3,4))
[[ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]]

构造单位矩阵

>>> print np.eye(3)
[[ 1.  0.  0.]
 [ 0.  1.  0.]
 [ 0.  0.  1.]]

获取数组的属性：

>>> a = np.zeros((2,2,2))
>>> print a.ndim   #数组的维数
3
>>> print a.shape  #数组每一维的大小
(2, 2, 2)
>>> print a.size   #数组的元素数
8
>>> print a.dtype  #元素类型
float64
>>> print a.itemsize  #每个元素所占的字节数
8

3.1.3 数组的基本运算

数组的算术运算是按元素逐个运算。数组运算后将创建包含运算结果的新数组。

与其他矩阵语言不同，NumPy中的乘法运算符*按元素逐个计算，矩阵乘法可以使用dot函数或创建矩阵对象实现（后续介绍）

数组的加减运算

>>> a= np.array([20,30,40,50])
>>> b= np.arange( 4)
>>> b
array([0, 1, 2, 3])
>>> c= a-b
>>> c
array([20, 29, 38, 47])

将运算结果更新原数组，不创建新数组

>>> a= np.ones((2,3), dtype=int)
>>> b= np.random.random((2,3))   ##生成2*3矩阵，元素为[0,1)范围的随机数
>>> a*= 3
>>> a
array([[3, 3, 3],
    　　 [3, 3, 3]])
>>> b+= a   #a转换为浮点类型相加
>>> b
array([[ 3.69092703, 3.8324276, 3.0114541],
    　　　 [ 3.18679111, 3.3039349, 3.37600289]])
>>> a+= b   # b转换为整数类型报错
TypeError: Cannot cast ufunc add output from dtype('float64') to dtype('int32') with casting rule 'same_kind'

当数组中存储的是不同类型的元素时，数组将使用占用更多位（bit）的数据类型作为其本身的数据类型，也就是偏向更精确的数据类型(这种行为叫做upcast)。

>>> a= np.ones(3, dtype=np.int32)
>>> b= np.linspace(0,np.pi,3)
>>> b.dtype.name
'float64'
>>> c= a+b
>>> c
array([ 1., 2.57079633, 4.14159265])
>>>  'float64'

数组乘法运算

>>> b**2
array([0, 1, 4, 9])
>>> 10*np.sin(a)
array([ 9.12945251,-9.88031624, 7.4511316, -2.62374854])
>>> a<35
array([True, True, False, False], dtype=bool)

03 机器学习 - Python基础回顾（三）（上）

1 什么是Numpy

2 安装导入了Numpy

3 Numpy组成

3.1 多维数组

3.1.1 Numpy中的数组

3.1.2 ndarray常用方法示例

3.1.3 数组的基本运算

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

03 机器学习 - Python基础回顾（三）（上）

1 什么是Numpy

2 安装导入了Numpy

3 Numpy组成

3.1 多维数组

3.1.1 Numpy中的数组

3.1.2 ndarray常用方法示例

3.1.3 数组的基本运算

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像