深度学习:PCA白化

简介: PCA白化

PCA白化

前置知识

一文读懂PCA

回顾PCA

PCA是在对观测数据进行基变换,新的坐标系使各数据维度线性无关,坐标系的重要程度从大到小衰减。

求解过程:

  1. 数据标准化(以远点为坐标原点)
  2. 求协方差矩阵
  3. 对协方差矩阵特征值分解找到最大方差的方向
  4. 对数据基变换

其中特征向量,就是最大方差方向,每个特征向量对应的特征值就是这个数据维度的方差。

PCA白化

PCA白化实际上就是在数据通过PCA进行基变换后再把数据进行标准化,让数据每个维度的方差全部为1。
公式推导如下:

符号定义:X:原始数据矩阵 M:原始数据协方差矩阵 设$S^{1/2}$为白化矩阵

在这里插入图片描述

对M特征值分解:
在这里插入图片描述
U就是我们要找的变换矩阵,转换数据基坐标:
$$X_{PCA}=UX$$

然后进行白化操作:
lambda为特征值
在这里插入图片描述

其中有的特征值很小,会造成数值溢出,就给它加上了1个常数项,于是把白化矩阵改为:

在这里插入图片描述

目录
相关文章
|
机器学习/深度学习 计算机视觉
深度学习常见的损失函数
深度学习常见的损失函数
188 1
深度学习常见的损失函数
|
14天前
|
机器学习/深度学习 人工智能 算法
探索机器学习:从线性回归到深度学习
本文将带领读者从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将通过代码示例,展示如何实现这些算法,并解释其背后的数学原理。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和知识。让我们一起踏上这段激动人心的旅程吧!
|
7月前
|
机器学习/深度学习 算法 TensorFlow
机器学习算法简介:从线性回归到深度学习
【5月更文挑战第30天】本文概述了6种基本机器学习算法:线性回归、逻辑回归、决策树、支持向量机、随机森林和深度学习。通过Python示例代码展示了如何使用Scikit-learn、statsmodels、TensorFlow库进行实现。这些算法在不同场景下各有优势,如线性回归处理连续值,逻辑回归用于二分类,决策树适用于规则提取,支持向量机最大化类别间隔,随机森林集成多个决策树提升性能,而深度学习利用神经网络解决复杂模式识别问题。理解并选择合适算法对提升模型效果至关重要。
253 4
|
5月前
|
机器学习/深度学习 算法 数据挖掘
深度学习中常用损失函数介绍
选择正确的损失函数对于训练机器学习模型非常重要。不同的损失函数适用于不同类型的问题。本文将总结一些常见的损失函数,并附有易于理解的解释、用法和示例
175 0
深度学习中常用损失函数介绍
|
7月前
|
机器学习/深度学习 自然语言处理 算法
Scikit-Learn与深度学习:融合与比较
【4月更文挑战第17天】本文比较了Scikit-Learn与深度学习框架在机器学习中的应用。Scikit-Learn以其易用性和丰富算法库深受喜爱,适合结构化数据处理,但面对复杂问题和大规模数据时可能力不从心。深度学习则以强大的神经网络解决图像、语音等任务,但需大量计算资源且解释性差。两者可互补,如预处理后输入深度学习模型,或在集成学习中融合。选择工具应考虑问题性质和资源,未来两者有望进一步融合创新。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|
7月前
|
机器学习/深度学习 算法
机器学习与深度学习的算法分类
机器学习与深度学习的算法分类
|
7月前
|
机器学习/深度学习 算法
深度学习之线性回归,使用maxnet工具
深度学习之线性回归,使用maxnet工具
84 0
|
机器学习/深度学习 Python
深度学习高维空间处理和解决
深度学习高维空间处理和解决
104 0
|
机器学习/深度学习 数据采集 自然语言处理
深度学习常用数据集汇总
深度学习常用数据集汇总
828 0