备案控制台

开发者社区人工智能文章正文

Machine Learning-L20-降维

2022-11-22 172

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Machine Learning-L20-降维

原始数据通常具有较高的维数导致维数灾难，通过降维（Dimensionality reduction）可以消除数据冗余与数据噪声，降低算法的计算开销，使得数据更加易用，结果更加易懂。

1. 主成分分析

主成分分析（PCA，Principal Component Analysis）将数据从原来的坐标系转换到新的坐标系，新坐标系的选择由数据本身决定。

1.1 问题定义

n维正交空间中，坐标系W n = { w 1 , w 2 , . . . , w n } ，其中w 是标准正交基，即 0

m个样本数据（已中心化）。

其中

将m 个数据的维度从n 维降到n ′ 维（通常由用户指定），新的坐标系样本点 x ^{( i )} 在新的n ′ 维坐标系中投影：

是 x ⁱ 在低维坐标系中第j 维的坐标。

使用 z ⁱ恢复原始数据x i ，则得到的恢复数据

1.2 优化目标

降维相当于使用一个超平面对样本进行表达，该超平面具有以下性质

最近重构性：样本点到这个超平面距离足够近
最大可分性：样本点在这个超平面上的投影尽可能分开

（1）基于最小投影距离

希望m 个n ′ 维的数据集尽可能的代表原始数据集，即数据从n 维降到n ′ 维的损失尽可能小，优化目标为

由于是数据集的协方差矩阵，为常量，优化目标等价于：

（2）基于最大投影方差

对于任意一个样本x ^{( i )} ，在新的坐标系中的投影为，在新坐标系中的投影方差为

要使所有的样本的投影方差和最大，也就是最大化的迹，即：

可以看出最近重构性等价于最大可分性。

1.3 问题求解

使用拉格朗日乘子法，引入拉格朗日函数

对W 求导，令导数等于0得，

W为X x ^t的n ′ 个特征向量组成的矩阵，而λ 为X x ^t 的若干特征值组成的矩阵，特征值在主对角线上，其余位置为0。将数据集从n 维降到n ′ 维时，需要找到最大的n ′个特征值对应的特征向量。

对协方差矩阵X x ^t进行特征值分解，将求得的特征值排序：

取前n ′ 个特征值对应的特征向量构成解

实践中，一般对X 进行奇异值分解代替协方差矩阵的特征值分解。

2. SVD

奇异值分解(SVD，Singular Value Decomposition)是以用于降维算法中的特征分解，还可以用于推荐系统，以及自然语言处理等领域，是很多机器学习算法的基石。

2.1 特征分解

A是一个n 阶矩阵，若λ 和n 维非零向量x 满足：

则λ是矩阵A 的一个特征值，x是矩阵A 对应特征值λ的特征向量。

∣ λ E − A ∣ 称为A 的特征多项式，当特征多项式等于0的时候，称为A 的特征方程，特征方程是一个齐次线性方程组，求解特征值的过程就是求解特征方程的解。

矩阵A的n 个特征值λ 1 ≤ λ 2 ≤ . . . ≤ λ n，以及这n 个特征值所对应的特征向量{ w 1 , w 2 , . . . w n } ，如果这n 个特征向量线性无关，那么矩阵A就可以用下式的特征分解表示：

其中，W 是这n 个特征向量所张成的n × n 矩阵，而Σ 为这n 个特征值为主对角线的n × n 阶矩阵。

一般会把W 的n 个特征向量标准化，即满足∣ ∣ wⁱ∣ ∣ 2 = 1 或者说，此时W 的n特征向量为标准正交基，满足w^Tw = I ，即w^T = w^-1 ，也就是说W为酉矩阵。

此时特征分解表达式可以写成：

2.2 SVD

要进行特征分解，矩阵A 必须为方阵，那么如果A不是方阵，即行和列不相同时，需要使用SVD。

假设矩阵A 是一个m × n的矩阵，定义矩阵A 的SVD为：

其中U 是一个m × m 的矩阵，V是一个n × n 的矩阵。U 和V 称为A的左/右奇异向量矩阵，都是酉矩阵，即满足u^Tu = I , v^Tv = I

Σ 是一个m × n的矩阵，除了主对角线上的元素以外全为0，主对角线上的每个元素都称为奇异值，通常将奇异值由大到小排列，这样Σ 便能由A 唯一确定。

奇异值与特征分解中的特征值类似，在奇异值矩阵中也是按照从大到小排列，而且奇异值的减少特别的快。很多情况下，前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上的比例。也就是说，也可以用最大的k kk个的奇异值和对应的左右奇异向量来近似描述矩阵：

其中k 要比n 小很多，即一个大的矩阵A 可以用三个小的矩阵来表示：

由于这个重要的性质，SVD可以用于PCA降维，来做数据压缩和去噪。也可以用于推荐算法，将用户和喜好对应的矩阵做特征分解，进而得到隐含的用户需求来做推荐。同时也可以用于NLP中的算法，比如潜在语义索引（LSI）。

文章标签：

自然语言处理

机器学习/深度学习

搜索推荐

索引

算法

机器学习Zero

目录

相关文章

机器学习Zero

|

机器学习/深度学习算法 vr&ar

Machine Learning-L19-条件随机场

Machine Learning-L19-条件随机场

机器学习Zero

100 0 2

Machine Learning-L19-条件随机场

机器学习Zero

|

机器学习/深度学习算法

Machine Learning-L8-SVM：支持向量机全面解析

Machine Learning-L8-SVM：支持向量机全面解析

机器学习Zero

89 0 1

Machine Learning-L8-SVM：支持向量机全面解析

Cool架构

|

机器学习/深度学习算法数据挖掘

周志华《Machine Learning》学习笔记(11)--聚类

聚类是一种经典的无监督学习方法，无监督学习的目标是通过对无标记训练样本的学习，发掘和揭示数据集本身潜在的结构与规律，即不依赖于训练数据集的类标记信息。

Cool架构

169 0 0

周志华《Machine Learning》学习笔记(11)--聚类

机器学习Zero

|

存储编解码算法

Machine Learning-L14-聚类（下）

Machine Learning-L14-聚类（下）

机器学习Zero

286 0 0

Machine Learning-L14-聚类（下）

机器学习Zero

|

机器学习/深度学习存储算法

Machine Learning-L14-聚类（上）

Machine Learning-L14-聚类

机器学习Zero

221 0 0

Machine Learning-L14-聚类（上）

机器学习Zero

|

算法

Machine Learning-L5-回归分析

Machine Learning-L5-回归分析

机器学习Zero

116 0 0

Machine Learning-L5-回归分析

机器学习Zero

|

人工智能算法关系型数据库

Machine Learning-L17-贝叶斯网络

Machine Learning-L17-贝叶斯网络

机器学习Zero

292 0 0

Machine Learning-L17-贝叶斯网络

机器学习Zero

|

机器学习/深度学习算法 Python

Machine Learning-L6-逻辑回归

Machine Learning-L6-逻辑回归

机器学习Zero

90 0 0

Machine Learning-L6-逻辑回归

机器学习Zero

|

算法数据建模数据挖掘

Machine Learning-L4-决策树

Machine Learning-L4-决策树

机器学习Zero

163 0 0

Machine Learning-L4-决策树

机器学习Zero

|

机器学习/深度学习自然语言处理算法

Machine Learning-L16-概率图模型

Machine Learning-L16-概率图模型

机器学习Zero

213 0 0

Machine Learning-L16-概率图模型

热门文章

最新文章

跟阿里云技术专家阙寒一起深度了解视频直播CDN技术

流批一体的近实时数仓的思考与设计

丰富、连接、待集成—MaxCompute 生态再出发

securecrt克隆会话与sshd 的 MaxSessions

McAfee揭秘网络最危险搜索关键词

微软再爆IE 0day漏洞绿盟科技提供预警及防护手段

uboot命令分析+实现【转】

读书笔记--101个shell脚本之#11--炫

SQL Server 深入解析索引存储(堆)

OAF_EO系列3 - Initialize详解和实现（案例）

【claude官网中文版】国内如何使用claude?记住这十大技巧！

调用云端Qwen系列大模型（TURBO、PLUS、MAX和MAX_LATEST）在国际商业咨询智能体场景的实践探索

已解决：国内如何使用Claude 3.5 Sonnet \ claude官网中文入口

HarmonyOS 5.0 Next实战应用开发—‘我的家乡’【HarmonyOS Next华为公司完全自研的操作系统】

自学记录鸿蒙API 13：实现多目标识别Object Detection

《探索人工智能产业的可持续发展模式与策略》

《人工智能助力社会学研究：数据挖掘与分析方法的深度探索》

《软体机器人与仿生机器人的人工智能控制技术：挑战与突破》

《探索机器人自主导航与路径规划技术的热点》

《集成学习：堆叠泛化与提升法在人工智能中的应用热点》

相关电子书

更多

Graph Neural Networks- Combing Deep Learning & Symbolic Reasoning

Deep Learning vs.Machine Learn

Developing a Machine Learning

下一篇

手把手教你白嫖阿里云服务器(免费领服务器)