Python3入门机器学习 - numpy篇

简介: numpy是python的一个支持矩阵、向量运算的库,由于python自带的list不仅效率低,也不会将数组看作矩阵或者向量,因此在机器学习中,使用numpy来作为操作数组及矩阵的工具numpy生成数组或矩阵numpy.

numpy是python的一个支持矩阵、向量运算的库,由于python自带的list不仅效率低,也不会将数组看作矩阵或者向量,因此在机器学习中,使用numpy来作为操作数组及矩阵的工具

numpy生成数组或矩阵

  • numpy.array([i for i in range(10)])
  • numpy.dtype
  • numpy.zeros(10,dtype=int //该参数可选)
  • numpy.zeros((3,5))
  • numpy.ones(shape=(3,5))
  • numpy.full(shape=(3,5),fill_value=66.0)
  • numpy.arange(10)
  • numpy.arange(0,1,0.2) arange函数生成步长相等的数列
  • numpy.linspace(0,20,10) linspace函数生成个数一定的数列

随机数

  • numpy.random.randomint(0,10) 生成[0,10)这个区间的一个随机整数
  • numpy.random.randomint(0,10,size=10) 十个随机整数
  • numpy.random.randonint(0,10,(4,5)) 4*5矩阵的随机整数
  • numpy.random.seed(123) 设置伪随机数种子,在每次random调用前使用相同的种子可得到相同的随机数序列
  • numpy.random.normal() 生成均值为0,方差为1的分布的随机浮点数
  • numpy.random.noraml(5,10,(3,5)) 均值为5,方差为10的3*5矩阵

矩阵属性

x=numpy.arange(10,(3,5))
x.ndim //x的维度
x.shape //x的各维度长度
x.size //x的总元素数量

使用X=x[:2,:2]获取的x的子矩阵,当修改X时同样会改变x的值,修改x也会改变X的值

因此我们如果我们想获得一个和x无关的x的子矩阵,需要使用X=x[:2,:2].copy()

使用y=x.reshape(5,3)可以将3*5的x矩阵改变为5*3的y矩阵,x的值不变

y=x.reshape(5,-1)可以自动帮我们计算出,要将x转换为5行,所需要的列数y依然变为5*3的矩阵

数据合并分割

  • numpy.concatenate([A,B],axis=1)
  • numpy.vstack(A,B)
  • numpy.hstack(A,B)
  • numpy.split(A,[2],axis=1)
  • numpy.vsplit(A,[2])
  • numpy.hsplit(A,[2])

矩阵运算

矩阵间所有直接使用运算符的运算都只会进行相应元素间的运算
例如

img_91572a8168b3cae58bdc12a523132c26.png
因此如果我们想要进行正常的矩阵运算,需要调用numpy支持的函数,例如乘法 A.dot(B)

  • numpy.linalg.inv(A) 求A矩阵的逆
  • numpy.linalg.pinv(A) 求A矩阵的伪逆矩阵

聚合运算

  • np.sum(A)
  • np.sum(A,axis=0) 沿着维度为0的轴进行求和运算
  • np.prod(A) 对A矩阵求所有元素乘积
  • np.mean(A) 求均值
  • np.median(A) 求中位数
  • np.percentile(A,50) 求第五十个百分位点的数值
  • np.var(A) 求方差
  • np.std(A) 求标准差

索引与排序

  • np.argmin(A) 求A中最小值的索引值
  • np.argmax(A)
  • np.random.shuffle(x) 对x进行乱序处理
  • np.argsort(x) 索引排序
  • np.partition(x,3) 以3为基准线排序
  • np.argpartition(x,3)

Fancy Indexing

numpy支持将数组作为索引来查询array里的值

img_45136eed87fc96f5e0e2fd69b93b2cd3.png

查询的数组甚至可以是布尔数组

img_f2fa0e39184727b76795259149291f64.png
img_0d28cc9d94dcd25af45564d7282f52b3.png

num.array的比较

img_1dd1e7414b16b50d49f4ddf04a1dc9a5.png

该比较方法可以推广到所有比较符以及矩阵

img_3455f378d59f1adf7e00408a4db13e63.png
  • np.any(判断条件) 只要变量中有一个元素满足判断条件,返回True
  • np.all(判断条件) 只有所有变量元素满足判断条件,返回Ture
  • np.sum(X%2==0,axis=1) 该命令查看矩阵X沿列方向有多少偶数
    img_5a27aec034afe997de2c1b9c240c5a81.png
  • np.sum((x<3) & (x>7)) 计算x中大于3,小于7的元素个数,在该运算中,只使用了一个&符号,也就是说,这里并非条件运算&&,而是位运算&(与运算)
    img_5be532f83789db39f84df8f0cdf4d94f.png
目录
相关文章
|
1天前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
16 1
|
5天前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
16 1
|
5天前
|
人工智能 数据挖掘 程序员
《Python 简易速速上手小册》第1章:Python 编程入门(2024 最新版)
《Python 简易速速上手小册》第1章:Python 编程入门(2024 最新版)
34 0
|
6天前
|
机器学习/深度学习 存储 算法
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
26 7
|
6天前
|
机器学习/深度学习 数据采集 算法
scikit-learn入门指南:从基础到实践
【4月更文挑战第17天】这篇指南介绍了scikit-learn,一个Python数据分析和机器学习的重要库。内容涵盖安装、数据加载与预处理、模型训练(如KNN分类器)、评估、调参优化及高级应用,如降维和聚类。通过实例展示了scikit-learn在分类任务中的使用,强调其在数据科学中的重要性。要深入了解,可参考官方文档和实践案例。
|
6天前
|
机器学习/深度学习 数据采集 算法
探索NumPy与机器学习库的集成之路
【4月更文挑战第17天】本文探讨了NumPy在机器学习中的核心作用,它为各类机器学习库提供基础数据处理和数值计算能力。NumPy的线性代数、优化算法和随机数生成等功能,对实现高效模型训练至关重要。scikit-learn等库广泛依赖NumPy进行数据预处理。未来,尽管面临大数据和复杂模型的性能挑战,NumPy与机器学习库的集成将继续深化,推动技术创新。
|
6天前
|
Python
用Python的Numpy求解线性方程组
用Python的Numpy求解线性方程组
|
7天前
|
程序员 索引 Python
06-python数据容器-set(集合)入门基础操作
06-python数据容器-set(集合)入门基础操作
|
7天前
|
机器学习/深度学习 人工智能 分布式计算
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
13 0
|
12天前
|
JavaScript 前端开发 API
游戏开发入门:Python后端与Vue前端的协同工作方式
【4月更文挑战第11天】使用Python后端(Flask或Django)和Vue.js前端开发游戏变得流行,能提高开发效率和可维护性。本文指导如何构建这样的项目,包括设置环境、创建虚拟环境、搭建后端API及前端Vue组件,强调前后端协作和API接口的重要性。这种架构促进团队合作,提升代码质量和游戏体验。