【线性代数】最小二乘与投影矩阵

简介:         前一篇文章《正交投影》中我们讲述了正交投影,现在我们来从正交投影的角度来看看我们熟悉的最小二乘法。我记得最早知道最小二乘法是在大一上高数课的时候,我们首先回顾一下什么是最小二乘法。
        前一篇文章 《正交投影》中我们讲述了正交投影,现在我们来从正交投影的角度来看看我们熟悉的最小二乘法。我记得最早知道最小二乘法是在大一上高数课的时候,我们首先回顾一下什么是最小二乘法。

1、最小二乘法

        最近机器学习比较火,机器学习中的许多算法都是对信息进行分类,比如说支持向量机就是根据已知信息来分类,神经网络可以找到输入输出的关系(当然,不能给出具体的数学表达式),这两种算法都能找到输入与输出的关系,分类和回归总是相辅相成的。以后有时间也准备写写关于机器学习方面的算法。 言归正传,最小二乘法的作用也是从一组数据中找到输入与输出之间的关系。
        原理:
        设经验方程是y=F(x),方程中含有一些待定系数an,给出真实值{(xi,yi)|i=1,2,...n},将这些x,y值代入方程然后作差,可以描述误差:yi-F(xi),为了考虑整体的误差,可以取平方和,之所以要平方是考虑到误差可正可负直接相加可以相互抵消,所以记误差(注意误差函数的选择有很多种,我们选用典型的误差函数)为:

E=∑(yi-F(xi))^2

    它是一个多元函数,有an共n个未知量,现在要求的是最小值。所以必然满足对各变量的偏导等于0,于是得到n个方程:


n个方程确定n个未知量为常量是理论上可以解出来的。用这种误差分析的方法进行回归方程的方法就是最小二乘法。

2、最小二乘与投影

    我这个人不喜欢看这些理论,公式推导,而更喜欢用例子来展示算法的思想。例如,在二维坐标系中,有三点,(1,1),(2,2),(3,2),那如何用一条直线来拟合这些点呢?

    首先,我们可以假设直线表达式如下所示:


然后计算误差函数:


在求得误差函数E对系数a,b的偏导,并使之为0:


由上式得到系数a,b的值,并得到拟合直线表达式:


通过最小二乘法得到的曲线如下:


线性代数角度看最小二乘法:

    同样假设拟合直线的表达式设为:

拟合的目的就是使得数据点都满足上述函数表达式,即:


用矩阵形式表示如下:


上面的式子通过高斯消元后,可以发现是无解的!
        我们可以发现等式的左边Aa的值是矩阵A中各个列向量的线性组合, 若Aa=b有解的话,则b一定在矩阵A的列空间内。上面的例子中,右边的向量显然不在其列空间中,因此方程无解。最小二乘法的思想就是在矩阵A的列空间中找到一个向量p,使得p与b的误差最小。下面我们就来求b:

Aa=p是肯定有解的,因为p在矩阵A的列空间中。要使得e向量的长度最短,当且仅当p为b在矩阵列空间上的投影!有上一篇《正交投影》中投影矩阵的通式可得:


那么将p代入公式Aa=p可得:


将具体数值代入得:


则可以得到:


b,p,e向量分别可以表示如下:


p,b在图中的表示如下:


原文:http://blog.csdn.net/tengweitw/article/details/41745923

作者:nineheadedbird


目录
相关文章
|
存储 设计模式 编译器
【C/C++ 虚函数以及替代方案】C++ 虚函数的使用开销以及替代方案(一)
【C/C++ 虚函数以及替代方案】C++ 虚函数的使用开销以及替代方案
689 0
|
1月前
|
人工智能 云计算
和五所高校一起,我们共同打造了一门AI课程!丨云工开物
9月1日,阿里云联合多所高校推出的「动手学AI:人工智能通识与实践」课程正式开放。课程涵盖理论与实践,支持多专业定制,助力高校AI人才培养。
|
SQL 缓存 NoSQL
高性能短链设计
高性能短链设计
|
机器学习/深度学习
DarkNet-19网络结构介绍
DarkNet-19网络结构介绍
2205 0
DarkNet-19网络结构介绍
|
测试技术
echarts 折线图 多条折线数据相同时展示的图形并没有重合
echarts 折线图 多条折线数据相同时展示的图形并没有重合
echarts 折线图 多条折线数据相同时展示的图形并没有重合
|
算法 数据可视化 安全
超融合数字孪生平台正式发布
日前,阿里云正式发布超融合数字孪生平台。相较于传统数字孪生技术,该平台能将感知、仿真、控制、可视等四域数据进行融合与计算,使得算法更快、算力更强,保障分析推演决策的速度与准确性。目前已广泛应用于高速公路、城市交通、码头及机场等场景,且成效显著。
2253 0
超融合数字孪生平台正式发布
|
传感器 安全
光学传感器在电子应用中的作用
光学传感器是设计用于检测入射光线并将其转换为电信号的电子元件。这些组件可用于测量入射光的强度并将其转换为集成测量设备可读的形式,具体取决于传感器类型。
549 0
|
JSON JavaScript 数据格式
vue项目axios的使用实例详解
vue项目axios的使用实例详解
992 0
vue项目axios的使用实例详解
|
存储 JSON 算法
冷饭新炒:理解JWT的实现原理和基本使用
这是《冷饭新炒》系列的第五篇文章。本文会翻炒一个用以产生访问令牌的开源标准JWT,介绍JWT的规范、底层实现原理、基本使用和应用场景。
543 0
冷饭新炒:理解JWT的实现原理和基本使用
|
机器学习/深度学习 存储 弹性计算
阿里云服务器X86计算、ARM计算、弹性裸金属服务器等架构如何选择
本文介绍了当下阿里云服务器x86计算,ARM计算,异构计算GPU/FPGA/NPU,弹性裸金属服务器(神龙),超级计算集群架构的主要特点及适用场景,可供新手用户参考选择!
1870 0
阿里云服务器X86计算、ARM计算、弹性裸金属服务器等架构如何选择