ML之DR之PCA:利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)

简介: ML之DR之PCA:利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)

初步理解PCA


#理解PCA:线性相关矩阵秩计算样例


import numpy as np

M = np.array([[1, 2], [1009, 2018]])      #初始化一个2*2的线性相关矩阵

result=np.linalg.matrix_rank(M, tol=None) #计算2*2线性相关矩阵的秩

print('得出矩阵的秩:',result)




输出结果


利用PCA对手写数字图片识别数据集进行降维处理




核心代码

 

X_digits = digits_train[np.arange(64)]

y_digits = digits_train[64]

estimator = PCA(n_components=2)

X_pca = estimator.fit_transform(X_digits)

   for i in range(len(colors)):

       px = X_pca[:, 0][y_digits.as_matrix() == i]

       py = X_pca[:, 1][y_digits.as_matrix()== i]

       plt.scatter(px, py, c=colors[i])

 

   plt.legend(np.arange(0,10).astype(str))

   plt.xlabel('First Principal Component')

   plt.ylabel('Second Principal Component')



相关文章
|
8月前
|
数据采集 机器学习/深度学习 搜索推荐
大模型开发: 描述主成分分析(PCA)以及它在降维中的应用。
PCA是广泛应用的降维技术,通过线性变换找到最大化方差的主成分,降低数据维度,简化计算并揭示数据结构。步骤包括数据预处理、计算协方差矩阵、特征值分解、选择主成分和数据转换。适用于图像识别、推荐系统等领域,但无监督性质可能导致类别信息丢失,且假设数据服从高斯分布。
134 1
|
5月前
|
机器学习/深度学习 数据采集
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
上述介绍仅为简要概述,每个模型在实施时都需要仔细调整与优化。为了实现高度精确的预测,模型选择与调参是至关重要的步骤,并且交叉验证是提升模型稳健性的有效途径。在真实世界的房价预测问题中,可能还需要结合地域经济、市场趋势等宏观因素进行综合分析。
92 3
|
5月前
|
机器学习/深度学习 算法 数据中心
【机器学习】面试问答:PCA算法介绍?PCA算法过程?PCA为什么要中心化处理?PCA为什么要做正交变化?PCA与线性判别分析LDA降维的区别?
本文介绍了主成分分析(PCA)算法,包括PCA的基本概念、算法过程、中心化处理的必要性、正交变换的目的,以及PCA与线性判别分析(LDA)在降维上的区别。
109 4
|
数据采集 机器学习/深度学习 数据可视化
R实战| PCA、tSNE、UMAP三种降维方法在R中的实现
R实战| PCA、tSNE、UMAP三种降维方法在R中的实现
335 0
|
8月前
|
机器学习/深度学习 数据采集 算法
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分析分类预测房价及交叉验证|数据分享
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分析分类预测房价及交叉验证|数据分享
|
8月前
|
数据可视化 API 算法框架/工具
Python用稀疏、高斯随机投影和主成分分析PCA对MNIST手写数字数据进行降维可视化
Python用稀疏、高斯随机投影和主成分分析PCA对MNIST手写数字数据进行降维可视化
|
机器学习/深度学习 移动开发 资源调度
机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类
机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类
|
机器学习/深度学习
机器学习系列(14)_PCA对图像数据集的降维_03
降维的目的之一是希望抛弃对模型带来负面影响的特征,同时,带有效信息的特征的方差应该是远大于噪音的,所以相比噪音,有效的特征所带来的信息不会在PCA当中大量抛弃。
机器学习系列(14)_PCA对图像数据集的降维_03
|
机器学习/深度学习 存储 传感器
【分类】基于PCA+Kmeans、PCA+LVQ、BP神经网络实现数据分类附matlab代码
【分类】基于PCA+Kmeans、PCA+LVQ、BP神经网络实现数据分类附matlab代码
|
机器学习/深度学习 算法 Python
机器学习算法之---PCA(主成分分析)
PCA(Principal Component Analysis)是一种常用的数据降维方法,可以将高维的数据降维到低维,以提取关键信息和减少噪音。它通过找到数据集中最重要的方向,并将数据在这个方向上投影,从而实现降维。
210 0
机器学习算法之---PCA(主成分分析)