ML之DR之PCA:利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)

简介: ML之DR之PCA:利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)

初步理解PCA


#理解PCA:线性相关矩阵秩计算样例


import numpy as np

M = np.array([[1, 2], [1009, 2018]])      #初始化一个2*2的线性相关矩阵

result=np.linalg.matrix_rank(M, tol=None) #计算2*2线性相关矩阵的秩

print('得出矩阵的秩:',result)




输出结果


利用PCA对手写数字图片识别数据集进行降维处理




核心代码

 

X_digits = digits_train[np.arange(64)]

y_digits = digits_train[64]

estimator = PCA(n_components=2)

X_pca = estimator.fit_transform(X_digits)

   for i in range(len(colors)):

       px = X_pca[:, 0][y_digits.as_matrix() == i]

       py = X_pca[:, 1][y_digits.as_matrix()== i]

       plt.scatter(px, py, c=colors[i])

 

   plt.legend(np.arange(0,10).astype(str))

   plt.xlabel('First Principal Component')

   plt.ylabel('Second Principal Component')



相关文章
|
23天前
|
数据采集 机器学习/深度学习 搜索推荐
大模型开发: 描述主成分分析(PCA)以及它在降维中的应用。
PCA是广泛应用的降维技术,通过线性变换找到最大化方差的主成分,降低数据维度,简化计算并揭示数据结构。步骤包括数据预处理、计算协方差矩阵、特征值分解、选择主成分和数据转换。适用于图像识别、推荐系统等领域,但无监督性质可能导致类别信息丢失,且假设数据服从高斯分布。
|
2天前
|
数据可视化 数据挖掘
R语言k-means聚类、层次聚类、主成分(PCA)降维及可视化分析鸢尾花iris数据集
R语言k-means聚类、层次聚类、主成分(PCA)降维及可视化分析鸢尾花iris数据集
18 2
|
2天前
|
机器学习/深度学习 算法 数据挖掘
SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型
SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
基于神经网络——鸢尾花识别(Iris)
鸢尾花识别是学习AI入门的案例,这里和大家分享下使用Tensorflow 2框架,编写程序,获取鸢尾花数据,搭建神经网络,最后训练和识别鸢尾花。
89 0
|
机器学习/深度学习 移动开发 资源调度
机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类
机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类
|
机器学习/深度学习
机器学习系列(14)_PCA对图像数据集的降维_03
降维的目的之一是希望抛弃对模型带来负面影响的特征,同时,带有效信息的特征的方差应该是远大于噪音的,所以相比噪音,有效的特征所带来的信息不会在PCA当中大量抛弃。
机器学习系列(14)_PCA对图像数据集的降维_03
|
机器学习/深度学习 存储 传感器
【分类】基于PCA+Kmeans、PCA+LVQ、BP神经网络实现数据分类附matlab代码
【分类】基于PCA+Kmeans、PCA+LVQ、BP神经网络实现数据分类附matlab代码
|
机器学习/深度学习 算法 Python
机器学习算法之---PCA(主成分分析)
PCA(Principal Component Analysis)是一种常用的数据降维方法,可以将高维的数据降维到低维,以提取关键信息和减少噪音。它通过找到数据集中最重要的方向,并将数据在这个方向上投影,从而实现降维。
143 0
机器学习算法之---PCA(主成分分析)
|
机器学习/深度学习 数据可视化 算法
.Kmeans无监督学习主成分分析(PCA)
.Kmeans无监督学习主成分分析(PCA)
172 0
.Kmeans无监督学习主成分分析(PCA)
ML之KMeans:利用KMeans算法对Boston房价数据集(两特征+归一化)进行二聚类分析
ML之KMeans:利用KMeans算法对Boston房价数据集(两特征+归一化)进行二聚类分析
ML之KMeans:利用KMeans算法对Boston房价数据集(两特征+归一化)进行二聚类分析