Python3入门机器学习 - numpy篇

简介: numpy是python的一个支持矩阵、向量运算的库,由于python自带的list不仅效率低,也不会将数组看作矩阵或者向量,因此在机器学习中,使用numpy来作为操作数组及矩阵的工具numpy生成数组或矩阵numpy.

numpy是python的一个支持矩阵、向量运算的库,由于python自带的list不仅效率低,也不会将数组看作矩阵或者向量,因此在机器学习中,使用numpy来作为操作数组及矩阵的工具

numpy生成数组或矩阵

  • numpy.array([i for i in range(10)])
  • numpy.dtype
  • numpy.zeros(10,dtype=int //该参数可选)
  • numpy.zeros((3,5))
  • numpy.ones(shape=(3,5))
  • numpy.full(shape=(3,5),fill_value=66.0)
  • numpy.arange(10)
  • numpy.arange(0,1,0.2) arange函数生成步长相等的数列
  • numpy.linspace(0,20,10) linspace函数生成个数一定的数列

随机数

  • numpy.random.randomint(0,10) 生成[0,10)这个区间的一个随机整数
  • numpy.random.randomint(0,10,size=10) 十个随机整数
  • numpy.random.randonint(0,10,(4,5)) 4*5矩阵的随机整数
  • numpy.random.seed(123) 设置伪随机数种子,在每次random调用前使用相同的种子可得到相同的随机数序列
  • numpy.random.normal() 生成均值为0,方差为1的分布的随机浮点数
  • numpy.random.noraml(5,10,(3,5)) 均值为5,方差为10的3*5矩阵

矩阵属性

x=numpy.arange(10,(3,5))
x.ndim //x的维度
x.shape //x的各维度长度
x.size //x的总元素数量

使用X=x[:2,:2]获取的x的子矩阵,当修改X时同样会改变x的值,修改x也会改变X的值

因此我们如果我们想获得一个和x无关的x的子矩阵,需要使用X=x[:2,:2].copy()

使用y=x.reshape(5,3)可以将3*5的x矩阵改变为5*3的y矩阵,x的值不变

y=x.reshape(5,-1)可以自动帮我们计算出,要将x转换为5行,所需要的列数y依然变为5*3的矩阵

数据合并分割

  • numpy.concatenate([A,B],axis=1)
  • numpy.vstack(A,B)
  • numpy.hstack(A,B)
  • numpy.split(A,[2],axis=1)
  • numpy.vsplit(A,[2])
  • numpy.hsplit(A,[2])

矩阵运算

矩阵间所有直接使用运算符的运算都只会进行相应元素间的运算
例如

img_91572a8168b3cae58bdc12a523132c26.png
因此如果我们想要进行正常的矩阵运算,需要调用numpy支持的函数,例如乘法 A.dot(B)

  • numpy.linalg.inv(A) 求A矩阵的逆
  • numpy.linalg.pinv(A) 求A矩阵的伪逆矩阵

聚合运算

  • np.sum(A)
  • np.sum(A,axis=0) 沿着维度为0的轴进行求和运算
  • np.prod(A) 对A矩阵求所有元素乘积
  • np.mean(A) 求均值
  • np.median(A) 求中位数
  • np.percentile(A,50) 求第五十个百分位点的数值
  • np.var(A) 求方差
  • np.std(A) 求标准差

索引与排序

  • np.argmin(A) 求A中最小值的索引值
  • np.argmax(A)
  • np.random.shuffle(x) 对x进行乱序处理
  • np.argsort(x) 索引排序
  • np.partition(x,3) 以3为基准线排序
  • np.argpartition(x,3)

Fancy Indexing

numpy支持将数组作为索引来查询array里的值

img_45136eed87fc96f5e0e2fd69b93b2cd3.png

查询的数组甚至可以是布尔数组

img_f2fa0e39184727b76795259149291f64.png
img_0d28cc9d94dcd25af45564d7282f52b3.png

num.array的比较

img_1dd1e7414b16b50d49f4ddf04a1dc9a5.png

该比较方法可以推广到所有比较符以及矩阵

img_3455f378d59f1adf7e00408a4db13e63.png
  • np.any(判断条件) 只要变量中有一个元素满足判断条件,返回True
  • np.all(判断条件) 只有所有变量元素满足判断条件,返回Ture
  • np.sum(X%2==0,axis=1) 该命令查看矩阵X沿列方向有多少偶数
    img_5a27aec034afe997de2c1b9c240c5a81.png
  • np.sum((x<3) & (x>7)) 计算x中大于3,小于7的元素个数,在该运算中,只使用了一个&符号,也就是说,这里并非条件运算&&,而是位运算&(与运算)
    img_5be532f83789db39f84df8f0cdf4d94f.png
目录
相关文章
|
27天前
|
机器学习/深度学习 数据采集 算法
量子机器学习入门:三种数据编码方法对比与应用
在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。
120 8
|
7月前
|
机器学习/深度学习 算法 Python
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习中一种重要的特征选择技术,通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。该方法从完整特征集出发,逐步剔除不重要的特征,最终保留最具影响力的变量子集。其优势包括提升模型简洁性和性能,减少过拟合,降低计算复杂度。然而,该方法在高维特征空间中计算成本较高,且可能陷入局部最优解。适用于线性回归、逻辑回归等统计学习模型。
260 7
|
5月前
|
机器学习/深度学习 人工智能 算法
Scikit-learn:Python机器学习的瑞士军刀
想要快速入门机器学习但被复杂算法吓退?本文详解Scikit-learn如何让您无需深厚数学背景也能构建强大AI模型。从数据预处理到模型评估,从垃圾邮件过滤到信用风险评估,通过实用案例和直观图表,带您掌握这把Python机器学习的'瑞士军刀'。无论您是AI新手还是经验丰富的数据科学家,都能从中获取将理论转化为实际应用的关键技巧。了解Scikit-learn与大语言模型的最新集成方式,抢先掌握机器学习的未来发展方向!
803 12
Scikit-learn:Python机器学习的瑞士军刀
|
8月前
|
机器学习/深度学习 数据可视化 算法
Python与机器学习:使用Scikit-learn进行数据建模
本文介绍如何使用Python和Scikit-learn进行机器学习数据建模。首先,通过鸢尾花数据集演示数据准备、可视化和预处理步骤。接着,构建并评估K近邻(KNN)模型,展示超参数调优方法。最后,比较KNN、随机森林和支持向量机(SVM)等模型的性能,帮助读者掌握基础的机器学习建模技巧,并展望未来结合深度学习框架的发展方向。
Python与机器学习:使用Scikit-learn进行数据建模
|
7月前
|
机器学习/深度学习 数据可视化 TensorFlow
Python 高级编程与实战:深入理解数据科学与机器学习
本文深入探讨了Python在数据科学与机器学习中的应用,介绍了pandas、numpy、matplotlib等数据科学工具,以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目,如数据可视化和鸢尾花数据集分类,帮助读者掌握这些技术。最后提供了进一步学习资源,助力提升Python编程技能。
|
7月前
|
机器学习/深度学习 数据可视化 算法
Python 高级编程与实战:深入理解数据科学与机器学习
在前几篇文章中,我们探讨了 Python 的基础语法、面向对象编程、函数式编程、元编程、性能优化和调试技巧。本文将深入探讨 Python 在数据科学和机器学习中的应用,并通过实战项目帮助你掌握这些技术。
|
10月前
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
495 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
|
11月前
|
机器学习/深度学习 数据采集
机器学习入门——使用Scikit-Learn构建分类器
机器学习入门——使用Scikit-Learn构建分类器
|
11月前
|
机器学习/深度学习 数据可视化 数据处理
掌握Python数据科学基础——从数据处理到机器学习
掌握Python数据科学基础——从数据处理到机器学习
170 0
|
11月前
|
机器学习/深度学习 数据采集 人工智能
机器学习入门:Python与scikit-learn实战
机器学习入门:Python与scikit-learn实战
359 0

热门文章

最新文章

推荐镜像

更多