机器学习常用算法盘点

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介:

   在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类。在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此之间的关系有一个比较深刻的了解。   

   下面是一张算法思维导图,点击放大查看。

wKioL1fWWH3jU8eLAAH_3B2VOBE789.png

从学习方式分类


算法对一个问题建模的方式很多,可以基于经历、环境,或者任何我们称之为输入数据的东西。机器学习和人工智能的教科书通常会让你首先考虑算法能够采用什么方式学习。实际上,算法能够采取的学习方式或者说学习模型只有几种,下面我会一一说明。对机器学习算法进行分类是很有必要的事情,因为这迫使你思考输入数据的作用以及模型准备过程,从而选择一个最适用于你手头问题的算法。


1、监督学习

   输入数据被称为训练数据,并且每一个都带有标签,比如“广告/非广告”,或者当时的股票价格。通过训练过程建模,模型需要做出预测,如果预测出错会被修正。直到模型输出准确的结果,训练过程会一直持续。常用于解决的问题有分类和回归。常用的算法包括逻辑回归和BP神经网络。

wKioL1fWWSSALQTMAAAxNisOfKQ563.png

2、无监督学习


输入数据没有标签,输出没有标准答案,就是一系列的样本。无监督学习通过推断输入数据中的结构建模。这可能是提取一般规律,可以是通过数学处理系统地减少冗余,或者根据相似性组织数据。常用于解决的问题有聚类、降维和关联规则的学习。常用的算法包括 Apriori 算法和 K 均值算法。

wKioL1fWWTuA4UUnAAAtwuVCNvQ504.png

3、半监督学习


半监督学习的输入数据包含带标签和不带标签的样本。半监督学习的情形是,有一个预期中的预测,但模型必须通过学习结构整理数据从而做出预测。常用于解决的问题是分类和回归。常用的算法是所有对无标签数据建模进行预测的算法(即无监督学习)的延伸。

wKioL1fWWUeB2-7EAAAyu25Kk14449.png



从功能角度分类


研究人员常常通过功能相似对算法进行分类。例如,基于树的方法和基于神经网络的方法。这种方法也是我个人认为最有用的分类方法。不过,这种方法也并非完美,比如学习矢量量化(LVQ),就既可以被归为神经网络方法,也可以被归为基于实例的方法。此外,像回归和聚类,就既可以形容算法,也可以指代问题。


为了避免重复,本文将只在最适合的地方列举一次。下面的算法和分类都不齐备,但有助于你了解整个领域大概。(说明:用于分类和回归的算法带有很大的个人主观倾向;欢迎补充我遗漏的条目。)


1、回归算法


回归分析是研究自变量和因变量之间关系的一种预测模型技术。这些技术应用于预测时间序列模型和找到变量之间关系。回归分析也是一种常用的统计学方法,经由统计机器学习融入机器学习领域。“回归”既可以指算法也可以指问题,因此在指代的时候容易混淆。实际上,回归就是一个过程而已。常用的回归算法包括:


  • 普通最小二乘回归(OLSR)

  • 线性回归

  • 逻辑回归

  • 逐步回归

  • 多元自适应回归样条法(MARS)

  • 局部估计平滑散点图(LOESS)

wKiom1fWWXXDAy-vAAAxH38w-HM352.png


2、基于实例的学习算法


基于实例的学习通过训练数据的样本或事例建模,这些样本或事例也被视为建模所必需的。这类模型通常会建一个样本数据库,比较新的数据和数据库里的数据,通过这种方式找到最佳匹配并做出预测。换句话说,这类算法在做预测时,一般会使用相似度准则,比对待预测的样本和原始样本之间的相似度,再做出预测。因此,基于实例的方法也被称之为赢家通吃的方法(winner-take-all)和基于记忆的学习(memory-based learning)。常用的基于实例的学习算法包括:


  • k-邻近算法(kNN)

  • 学习矢量量化算法(LVQ)

  • 自组织映射算法(SOM)

  • 局部加权学习算法(LWL)

wKioL1fWWYOC5D30AAAzs-Qr8P4802.png

3、正则化算法

 

正则化算法背后的思路是,参数值比较小的时候模型更加简单。对模型的复杂度会有一个惩罚值,偏好简单的、更容易泛化的模型,正则化算法可以说是这种方法的延伸。我把正则化算法单独列出来,原因就是我听说它们十分受欢迎、功能强大,而且能够对其他方法进行简单的修饰。常用的正则化算法包括:

 

  • 岭回归

  • LASSO 算法

  • Elastic Net

  • 最小角回归算法(LARS)

wKiom1fWWZDTUkRxAAAmUrkajhg153.png

4、决策树算法


决策树算法的目标是根据数据属性的实际值,创建一个预测样本目标值的模型。训练时,树状的结构会不断分叉,直到作出最终的决策。也就是说,预测阶段模型会选择路径进行决策。决策树常被用于分类和回归。决策树一般速度快,结果准,因此也属于最受欢迎的机器学习算法之一。常用的决策树算法包括:


  • 分类和回归树(CART)

  • ID3 算法

  • C4.5 算法和 C5.0 算法(它们是一种算法的两种不同版本)

  • CHAID 算法

  • 单层决策树

  • M5 算法

  • 条件决策树

wKiom1fWWaPxnY1AAAAxEPm8Dmw452.png

5、贝叶斯算法


贝叶斯方法指的是那些明确使用贝叶斯定理解决分类或回归等问题的算法。常用的贝叶斯算法包括:


  • 朴素贝叶斯算法

  • 高斯朴素贝叶斯算法

  • 多项式朴素贝叶斯算法

  • AODE 算法

  • 贝叶斯信念网络(BBN)

  • 贝叶斯网络(BN)

wKioL1fWWcSi1LEwAAA3YSNaAu4575.png

6、聚类算法


聚类跟回归一样,既可以用来形容一类问题,也可以指代一组方法。聚类方法通常涉及质心(centroid-based)或层次(hierarchal)等建模方式,所有的方法都与数据固有的结构有关,目标是将数据按照它们之间共性最大的组织方式分成几组。换句话说,算法将输入样本聚成围绕一些中心的数据团,通过这样的方式发现数据分布结构中的规律。常用的聚类算法包括:


  • K-均值

  • K-中位数

  • EM 算法

  • 分层聚类算法

wKiom1fWWdTg7Wi_AAApL4-UGOc789.png

7、关联规则学习


关联规则学习在数据不同变量之间观察到了一些关联,算法要做的就是找出最能描述这些关系的规则,也就是获取一个事件和其他事件之间依赖或关联的知识。常用的关联规则算法有:


  • Apriori 算法

  • Eclat 算法

wKioL1fWWeDTtCa3AAAzsxiHqPI839.png

8、人工神经网络


人工神经网络是一类受生物神经网络的结构及/或功能启发而来的模型。它们是一类常用于解决回归和分类等问题的模式匹配,不过,实际上是一个含有成百上千种算法及各种问题变化的子集。注意这里我将深度学习从人工神经网络算法中分离了出去,因为深度学习实在太受欢迎。人工神经网络指的是更加经典的感知方法。常用的人工神经网络包括:


  • 感知机

  • 反向传播算法(BP 神经网络)

  • Hopfield网络

  • 径向基函数网络(RBFN)

wKioL1fWWhrAKx8GAAArF1LWayU102.png

9、深度学习算法


深度学习算法是人工神经网络的升级版,充分利用廉价的计算力。近年来,深度学习得到广泛应用,尤其是语音识别、图像识别。深度学习算法会搭建规模更大、结构更复杂的神经网络,正如上文所说,很多深度学习方法都涉及半监督学习问题,这种问题的数据一般量极大,而且只有很少部分带有标签。常用的深度学习算法包括:


  • 深度玻尔兹曼机(DBM)

  • 深度信念网络(DBN)

  • 卷积神经网络(CNN)

  • 栈式自编码算法(Stacked Auto-Encoder)

wKiom1fWWiuxTpuKAABJIbm-m_U823.png

10、降维算法


降维算法和聚类有些类似,也是试图发现数据的固有结构。但是,降维算法采用的是无监督学习的方式,用更少(更低维)的信息进行总结和描述。降维算法可以监督学习的方式,被用于多维数据的可视化或对数据进行简化处理。很多降维算法经过修改后,也被用于分类和回归的问题。常用的降维算法包括:


  • 主成分分析法(PCA)

  • 主成分回归(PCR)

  • 偏最小二乘回归(PLSR)

  • 萨蒙映射

  • 多维尺度分析(MDS)

  • 投影寻踪法(PP)

  • 线性判别分析(LDA)

  • 混合判别分析(MDA)

  • 二次判别分析(QDA)

  • 灵活判别分析(Flexible Discriminant Analysis,FDA)

wKioL1fWWjnB_W3IAAAn8FIJHO4703.png

11、模型融合算法


模型融合算法将多个简单的、分别单独训练的弱机器学习算法结合在一起,这些弱机器学习算法的预测以某种方式整合成一个预测。通常这个整合后的预测会比单独的预测要好一些。构建模型融合算法的主要精力一般用于决定将哪些弱机器学习算法以什么样的方式结合在一起。模型融合算法是一类非常强大的算法,因此也很受欢迎。常用的模型融合增强方法包括:


  • Boosting 

  • Bagging

  • AdaBoost 

  • 堆叠泛化(混合)

  • GBM 算法

  • GBRT 算法

  • 随机森林

wKiom1fWWlfjym8cAAAnwfWBiS4997.png

12、其他


还有很多算法都没有涉及。例如,支持向量机(SVM)应该被归为哪一组?还是说它自己单独成一组?我还没有提到的机器学习算法包括:


  • 特征选择算法

  • Algorithm accuracy evaluation

  • Performance measures

   

事先说明一点,我没有涵盖机器学习特殊子领域的算法,比如:

  • 计算智能(进化算法等)、

  • 计算机视觉(CV)、

  • 自然语言处理(NLP)、

  • 推荐系统、

  • 强化学习和图模型。


http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/





   在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类。在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此之间的关系有一个比较深刻的了解。   

   下面是一张算法思维导图,点击放大查看。

wKioL1fWWH3jU8eLAAH_3B2VOBE789.png

从学习方式分类


算法对一个问题建模的方式很多,可以基于经历、环境,或者任何我们称之为输入数据的东西。机器学习和人工智能的教科书通常会让你首先考虑算法能够采用什么方式学习。实际上,算法能够采取的学习方式或者说学习模型只有几种,下面我会一一说明。对机器学习算法进行分类是很有必要的事情,因为这迫使你思考输入数据的作用以及模型准备过程,从而选择一个最适用于你手头问题的算法。


1、监督学习

   输入数据被称为训练数据,并且每一个都带有标签,比如“广告/非广告”,或者当时的股票价格。通过训练过程建模,模型需要做出预测,如果预测出错会被修正。直到模型输出准确的结果,训练过程会一直持续。常用于解决的问题有分类和回归。常用的算法包括逻辑回归和BP神经网络。

wKioL1fWWSSALQTMAAAxNisOfKQ563.png

2、无监督学习


输入数据没有标签,输出没有标准答案,就是一系列的样本。无监督学习通过推断输入数据中的结构建模。这可能是提取一般规律,可以是通过数学处理系统地减少冗余,或者根据相似性组织数据。常用于解决的问题有聚类、降维和关联规则的学习。常用的算法包括 Apriori 算法和 K 均值算法。

wKioL1fWWTuA4UUnAAAtwuVCNvQ504.png

3、半监督学习


半监督学习的输入数据包含带标签和不带标签的样本。半监督学习的情形是,有一个预期中的预测,但模型必须通过学习结构整理数据从而做出预测。常用于解决的问题是分类和回归。常用的算法是所有对无标签数据建模进行预测的算法(即无监督学习)的延伸。

wKioL1fWWUeB2-7EAAAyu25Kk14449.png



从功能角度分类


研究人员常常通过功能相似对算法进行分类。例如,基于树的方法和基于神经网络的方法。这种方法也是我个人认为最有用的分类方法。不过,这种方法也并非完美,比如学习矢量量化(LVQ),就既可以被归为神经网络方法,也可以被归为基于实例的方法。此外,像回归和聚类,就既可以形容算法,也可以指代问题。


为了避免重复,本文将只在最适合的地方列举一次。下面的算法和分类都不齐备,但有助于你了解整个领域大概。(说明:用于分类和回归的算法带有很大的个人主观倾向;欢迎补充我遗漏的条目。)


1、回归算法


回归分析是研究自变量和因变量之间关系的一种预测模型技术。这些技术应用于预测时间序列模型和找到变量之间关系。回归分析也是一种常用的统计学方法,经由统计机器学习融入机器学习领域。“回归”既可以指算法也可以指问题,因此在指代的时候容易混淆。实际上,回归就是一个过程而已。常用的回归算法包括:


  • 普通最小二乘回归(OLSR)

  • 线性回归

  • 逻辑回归

  • 逐步回归

  • 多元自适应回归样条法(MARS)

  • 局部估计平滑散点图(LOESS)

wKiom1fWWXXDAy-vAAAxH38w-HM352.png


2、基于实例的学习算法


基于实例的学习通过训练数据的样本或事例建模,这些样本或事例也被视为建模所必需的。这类模型通常会建一个样本数据库,比较新的数据和数据库里的数据,通过这种方式找到最佳匹配并做出预测。换句话说,这类算法在做预测时,一般会使用相似度准则,比对待预测的样本和原始样本之间的相似度,再做出预测。因此,基于实例的方法也被称之为赢家通吃的方法(winner-take-all)和基于记忆的学习(memory-based learning)。常用的基于实例的学习算法包括:


  • k-邻近算法(kNN)

  • 学习矢量量化算法(LVQ)

  • 自组织映射算法(SOM)

  • 局部加权学习算法(LWL)

wKioL1fWWYOC5D30AAAzs-Qr8P4802.png

3、正则化算法

 

正则化算法背后的思路是,参数值比较小的时候模型更加简单。对模型的复杂度会有一个惩罚值,偏好简单的、更容易泛化的模型,正则化算法可以说是这种方法的延伸。我把正则化算法单独列出来,原因就是我听说它们十分受欢迎、功能强大,而且能够对其他方法进行简单的修饰。常用的正则化算法包括:

 

  • 岭回归

  • LASSO 算法

  • Elastic Net

  • 最小角回归算法(LARS)

wKiom1fWWZDTUkRxAAAmUrkajhg153.png

4、决策树算法


决策树算法的目标是根据数据属性的实际值,创建一个预测样本目标值的模型。训练时,树状的结构会不断分叉,直到作出最终的决策。也就是说,预测阶段模型会选择路径进行决策。决策树常被用于分类和回归。决策树一般速度快,结果准,因此也属于最受欢迎的机器学习算法之一。常用的决策树算法包括:


  • 分类和回归树(CART)

  • ID3 算法

  • C4.5 算法和 C5.0 算法(它们是一种算法的两种不同版本)

  • CHAID 算法

  • 单层决策树

  • M5 算法

  • 条件决策树

wKiom1fWWaPxnY1AAAAxEPm8Dmw452.png

5、贝叶斯算法


贝叶斯方法指的是那些明确使用贝叶斯定理解决分类或回归等问题的算法。常用的贝叶斯算法包括:


  • 朴素贝叶斯算法

  • 高斯朴素贝叶斯算法

  • 多项式朴素贝叶斯算法

  • AODE 算法

  • 贝叶斯信念网络(BBN)

  • 贝叶斯网络(BN)

wKioL1fWWcSi1LEwAAA3YSNaAu4575.png

6、聚类算法


聚类跟回归一样,既可以用来形容一类问题,也可以指代一组方法。聚类方法通常涉及质心(centroid-based)或层次(hierarchal)等建模方式,所有的方法都与数据固有的结构有关,目标是将数据按照它们之间共性最大的组织方式分成几组。换句话说,算法将输入样本聚成围绕一些中心的数据团,通过这样的方式发现数据分布结构中的规律。常用的聚类算法包括:


  • K-均值

  • K-中位数

  • EM 算法

  • 分层聚类算法

wKiom1fWWdTg7Wi_AAApL4-UGOc789.png

7、关联规则学习


关联规则学习在数据不同变量之间观察到了一些关联,算法要做的就是找出最能描述这些关系的规则,也就是获取一个事件和其他事件之间依赖或关联的知识。常用的关联规则算法有:


  • Apriori 算法

  • Eclat 算法

wKioL1fWWeDTtCa3AAAzsxiHqPI839.png

8、人工神经网络


人工神经网络是一类受生物神经网络的结构及/或功能启发而来的模型。它们是一类常用于解决回归和分类等问题的模式匹配,不过,实际上是一个含有成百上千种算法及各种问题变化的子集。注意这里我将深度学习从人工神经网络算法中分离了出去,因为深度学习实在太受欢迎。人工神经网络指的是更加经典的感知方法。常用的人工神经网络包括:


  • 感知机

  • 反向传播算法(BP 神经网络)

  • Hopfield网络

  • 径向基函数网络(RBFN)

wKioL1fWWhrAKx8GAAArF1LWayU102.png

9、深度学习算法


深度学习算法是人工神经网络的升级版,充分利用廉价的计算力。近年来,深度学习得到广泛应用,尤其是语音识别、图像识别。深度学习算法会搭建规模更大、结构更复杂的神经网络,正如上文所说,很多深度学习方法都涉及半监督学习问题,这种问题的数据一般量极大,而且只有很少部分带有标签。常用的深度学习算法包括:


  • 深度玻尔兹曼机(DBM)

  • 深度信念网络(DBN)

  • 卷积神经网络(CNN)

  • 栈式自编码算法(Stacked Auto-Encoder)

wKiom1fWWiuxTpuKAABJIbm-m_U823.png

10、降维算法


降维算法和聚类有些类似,也是试图发现数据的固有结构。但是,降维算法采用的是无监督学习的方式,用更少(更低维)的信息进行总结和描述。降维算法可以监督学习的方式,被用于多维数据的可视化或对数据进行简化处理。很多降维算法经过修改后,也被用于分类和回归的问题。常用的降维算法包括:


  • 主成分分析法(PCA)

  • 主成分回归(PCR)

  • 偏最小二乘回归(PLSR)

  • 萨蒙映射

  • 多维尺度分析(MDS)

  • 投影寻踪法(PP)

  • 线性判别分析(LDA)

  • 混合判别分析(MDA)

  • 二次判别分析(QDA)

  • 灵活判别分析(Flexible Discriminant Analysis,FDA)

wKioL1fWWjnB_W3IAAAn8FIJHO4703.png

11、模型融合算法


模型融合算法将多个简单的、分别单独训练的弱机器学习算法结合在一起,这些弱机器学习算法的预测以某种方式整合成一个预测。通常这个整合后的预测会比单独的预测要好一些。构建模型融合算法的主要精力一般用于决定将哪些弱机器学习算法以什么样的方式结合在一起。模型融合算法是一类非常强大的算法,因此也很受欢迎。常用的模型融合增强方法包括:


  • Boosting 

  • Bagging

  • AdaBoost 

  • 堆叠泛化(混合)

  • GBM 算法

  • GBRT 算法

  • 随机森林

wKiom1fWWlfjym8cAAAnwfWBiS4997.png

12、其他


还有很多算法都没有涉及。例如,支持向量机(SVM)应该被归为哪一组?还是说它自己单独成一组?我还没有提到的机器学习算法包括:


  • 特征选择算法

  • Algorithm accuracy evaluation

  • Performance measures

   

事先说明一点,我没有涵盖机器学习特殊子领域的算法,比如:

  • 计算智能(进化算法等)、

  • 计算机视觉(CV)、

  • 自然语言处理(NLP)、

  • 推荐系统、

  • 强化学习和图模型。


http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/




     本文转自stock0991 51CTO博客,原文链接:http://blog.51cto.com/qing0991/1851981,如需转载请自行联系原作者




相关文章
|
15天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
51 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
2月前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
2月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
63 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
2月前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
|
2月前
|
机器学习/深度学习 算法 Python
探索机器学习中的决策树算法:从理论到实践
【10月更文挑战第5天】本文旨在通过浅显易懂的语言,带领读者了解并实现一个基础的决策树模型。我们将从决策树的基本概念出发,逐步深入其构建过程,包括特征选择、树的生成与剪枝等关键技术点,并以一个简单的例子演示如何用Python代码实现一个决策树分类器。文章不仅注重理论阐述,更侧重于实际操作,以期帮助初学者快速入门并在真实数据上应用这一算法。
|
25天前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的决策树算法
【10月更文挑战第29天】本文将深入浅出地介绍决策树算法,一种在机器学习中广泛使用的分类和回归方法。我们将从基础概念出发,逐步深入到算法的实际应用,最后通过一个代码示例来直观展示如何利用决策树解决实际问题。无论你是机器学习的初学者还是希望深化理解的开发者,这篇文章都将为你提供有价值的见解和指导。
|
2月前
|
机器学习/深度学习 算法 大数据
机器学习入门:梯度下降算法(下)
机器学习入门:梯度下降算法(下)
|
2月前
|
机器学习/深度学习 算法 API
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
|
2月前
|
机器学习/深度学习 算法 数据处理
EM算法对人脸数据降维(机器学习作业06)
本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
35 0