高斯过程回归|机器学习推导系列(二十四)

简介: 高斯过程回归|机器学习推导系列(二十四)

一、概述


将⼀维高斯分布推⼴到多变量中就得到了高斯网络,将多变量推⼴到无限维,就得到了高斯过程。高斯过程是定义在连续域(时间/空间)上的无限多个高斯随机变量所组成的随机过程。具体的形式化的定义如下:

LWI9L$QATB7OQ9S}O{U}E%T.png


举个例子来说,下图的时间轴(也就是定义中的连续域)代表了人的一生,这里假设人能活100岁,从这个连续域里任意取多个时刻都会对应了一个高斯随机变量:


%@(T5$4(~QDBQL)P78WN0`8.png

                                          高斯过程


这里的每个随机变量可以认为是一个人在一生中这个阶段的表现值,服从一个高斯分布:


WT9NZYMDO2@XK3L0O~1OL{T.png

                                               高斯过程


在这个人人生的每一个阶段,如果他比较努力,他的表现可能就比均值高,如果不努力可能表现就比均值低,将每个高斯分布采样的样本点连起来就是高斯过程的一个样本:


82`%1VRYZY{X]80F($)S(SN.png

                                                  高斯过程


二、核贝叶斯线性回归-权重空间角度


之前的贝叶斯线性回归博客:贝叶斯线性回归|机器学习推导系列(二十三)


对于线性的数据,我们可以直接应用贝叶斯线性回归的方法,而对于非线性数据,可以尝试使用核方法将低位数据扩展到高维空间,然后再应用贝叶斯线性回归。类比支持向量机的核方法,如果最后的结果只和一个核函数,也就是关于)R(]2ADONHW(RB_{O9UQ_)N.png的内积有关,那么就可以应用核方法,同样的在非线性的贝叶斯线性回归回归中,如果将数据拓展到高维空间后后验的均值和方差都只与一个核函数有关,那说明将核方法应用在贝叶斯线性回归中是可行的。


对于线性数据的预测来说,有:


4AY67RQT4N7OP(`9TRMGXPH.png 

对于非线性数据,要使用核方法,首先要对其进行低维到高维的非线性转换:  


]C]60KI5PGC2_N8VQ01LF[0.png


上面的式子中,均值和方差都存在73VM9RE8(4W%]IW}2K3HAKM.png,这一项可以通过伍德伯里矩阵恒等式(Woodbury Matrix Identity)求出来,该恒等式如下:

T9ES)[$T%{~0_ZF8(_%J]~A.png

D)_}9%I$CV4{KORZQCTH8H3.png


因此这是一个核函数。


核贝叶斯线性回归也就是高斯过程回归,这个从参数TZZ7N`UKD5}0GRY[WU(3OYL.png的角度进行推导的过程是高斯过程回归的权重空间角度。


三、从权重空间角度到函数空间角度


对于应用了核方法的贝叶斯线性回归,满足:


$%ASNU%SZ@Z~4)M`E42K~9X.png

这里给定先验TZZ7N`UKD5}0GRY[WU(3OYL.png满足一个高斯分布:

}9M1IFU%HD8(687]KD(%69H.png

@AUV)HG2XLKYYJ]R22CLA~Q.png

四、函数空间角度

AFONX`L]$1PBZ77`1FUBK2L.png

B4~F@SNOBAR`4}MCZ%GBQ%9.png

而对于预测问题,我们要求的是30@YYU(V$91%V@TRH[R6Z(N.png这个概率,其实也就是2QSOXQ(@8}PGY]78M97YEOB.png,也就是上面拼接起来的向量的一个条件概率分布,而求解高维高斯分布的条件概率分布的方法在高斯分布|机器学习推导系列(二)这一篇中已经推导过了,有现成的公式可以套用:


CUD}$AXCOWA083VM5{6I}CD.png


显然比起权重空间角度的方法,从函数空间角度出发更容易求解这个问题。

相关文章
|
7月前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
|
机器学习/深度学习
【阿旭机器学习实战】【21】通过SVM分类与回归实战案例,对比支持向量机(SVM)3种SVM不同核函数
【阿旭机器学习实战】【21】通过SVM分类与回归实战案例,对比支持向量机(SVM)3种SVM不同核函数
【阿旭机器学习实战】【21】通过SVM分类与回归实战案例,对比支持向量机(SVM)3种SVM不同核函数
|
机器学习/深度学习 算法 数据挖掘
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
|
机器学习/深度学习 人工智能 移动开发
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
396 0
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 算法
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
402 0
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 资源调度
【机器学习】线性回归——最小二乘法的概率解释高斯噪声(理论+图解+公式推导)
【机器学习】线性回归——最小二乘法的概率解释高斯噪声(理论+图解+公式推导)
320 0
【机器学习】线性回归——最小二乘法的概率解释高斯噪声(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 资源调度
【机器学习】聚类算法——高斯混合聚类(理论+图解)
【机器学习】聚类算法——高斯混合聚类(理论+图解)
461 0
【机器学习】聚类算法——高斯混合聚类(理论+图解)
|
机器学习/深度学习 人工智能 算法
机器学习之回归
人工智能(AI)长远以来的目标:希望机器可以和人一样聪明。
217 0
机器学习之回归
|
机器学习/深度学习 Python
在机器学习回归问题中,你应该使用哪种评估指标?
在机器学习回归问题中,你应该使用哪种评估指标?
287 0
在机器学习回归问题中,你应该使用哪种评估指标?
|
机器学习/深度学习 算法
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导