约束优化问题|机器学习推导系列(六)

简介: 约束优化问题|机器学习推导系列(六)

一、简介


约束优化问题的原问题(Primal Problem)的一般形式如下:


(%TQ~55U4VIJC2O1LWKK~Z2.png


求解约束优化问题需要用到拉格朗日乘子法,定义拉格朗日函数:


P0[57$I[TABU7EKU[2@IX~J.png


然后原问题可以转化为以下优化问题,这两个优化问题具有同样的解:


`C%W_8%QA7}TS9$OHWB9[UR.png


可以说明一下为什么上述约束优化问题可以求得原问题的最优解:


P~{OVBP94BKT3YX2WA~8(SW.png


也就是说虽然拉格朗日函数对M82{4DRA1(}0}K]0Y8GAINW.png没有约束,但是在求解过程中会过滤掉不符合原问题M82{4DRA1(}0}K]0Y8GAINW.png的约束的M82{4DRA1(}0}K]0Y8GAINW.png


二、对偶关系证明


原问题的对偶问题为


CULD{3T_~57HXC%S7_UI$SH.png


可以看到原问题是关于@VFD1%6O9)_2I9B@MWU3EZU.png的函数,对偶问题是关于OZG$QLR80ECDBDGR(]9ON%W.png的函数。有如下定理:


O20~DNRUE5}~04N_~%`%_K1.png


这个关系可以简单地得到证明:


YO~RRN56Y2@2OYNX$2WU0QJ.png


三、对偶性的几何解释


I%$$F5S$~(~5MSC~FU~G}HN.png


对于上述约束优化问题,可以写出它的拉格朗日函数:


30E%%MY]AT(A[][()1ZNQQ4.png


然后表示出原问题和对偶问题的最优解@YHUFX8FNGVEZBDS~$CBG2R.png

VM[_SN)2_JWPUAEHN32XQJA.png


接着定义集合G:


C`LPWU7D]W14F))`8FJ}2@6.png


集合G在二维坐标系下表示的空间假设为下图:


I(2EGIIFFWG}SD21OKBOE8R.png


因此P`VH})BV]]}@E_OA}N_P`4M.png可以表示为:

UC(O]_$O}YP}L_]03N@57CN.png

P`VH})BV]]}@E_OA}N_P`4M.png在图中可以表示为:

H5@IC@$QJR7VM`DEOJ~)RUA.png

                                               p*


NVSDJ5}HZ1LQ755BIE)@IPQ.png

P}L%R{TT~`VV9CU)Y83}71Q.png

FFBV815D@9161B3$VW81[8T.png

_8C`@$XO(7WQPTOXVA67R79.png

                                         g(λ)


S4HUI_A0B_EV(%SLU[UJ]2L.png

在某些特殊情况下可以使得强对偶关系成立,在图中表示如下:


O~JLHPF8Y$7@A%G(%F[`}%T.png

                                                   强对偶关系


H(]Y$79_}4`PXZ~HGEAC]W6.png

841QSEH$RLCWWUM__@RB1GA.png

({`(]T@P3CBU8]_IG0PN3_4.png

四、Slater条件

BV6@BL74CHF@{YOPJ`(SU%H.png

R6H2YA3KS9(U_Y``G82]_`E.png


有以下两点说明:


①对于大多数凸优化问题,Slater条件是成立的;


②放松的Slater条件:5E}AW3HMW59SBCMMG3UNQ8M.png中的仿射函数可以不用验证。因为在定义域内寻找一个满足所有FKHW(`UV0[KS_[3WG8VZ~~X.png的点是比较困难的,因此放松的Slater条件会减少一些复杂度。


五、KKT条件


对于原问题:


3IPP%W$T6L3]]P]TP38T[MP.png


以及其对偶问题:


R{]{LL2BT9@CCZ1XRHIDMU5.png


如果原问题和对偶问题满足强对偶关系,则原问题和对偶问题具有相同的最优解,另外它们还天然地满足KKT条件(Karush-Kuhn-Tucker条件)。假设原问题最优解`K}S`Y7(A04V9_OX0F`[]VX.png,对偶问题最优解对应4AR2]_B@W633J3W$DU)BFA2.png ,则KKT条件为:

F{MYTHT7CY$0L88DVFF`DJG.png


可以进行以下证明:


`)@8SDX0O~$I483TB_VHG7U.png

相关文章
|
机器学习/深度学习 编解码 测试技术
Absolut! 能不受约束地生成抗体-抗原结构,指导用于抗体特异性预测的机器学习方法
Absolut! 能不受约束地生成抗体-抗原结构,指导用于抗体特异性预测的机器学习方法
|
机器学习/深度学习
受限玻尔兹曼机|机器学习推导系列(二十五)
受限玻尔兹曼机|机器学习推导系列(二十五)
677 0
受限玻尔兹曼机|机器学习推导系列(二十五)
|
机器学习/深度学习 人工智能 移动开发
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
285 0
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
|
机器学习/深度学习 人工智能 算法
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
186 0
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
|
机器学习/深度学习 算法 数据挖掘
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
100天搞定机器学习|day44 k均值聚类数学推导与python实现
|
机器学习/深度学习 算法
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
100天搞定机器学习|day38 反向传播算法推导
|
机器学习/深度学习 算法
Sigmoid信念网络|机器学习推导系列(二十八)
Sigmoid信念网络|机器学习推导系列(二十八)
217 0
Sigmoid信念网络|机器学习推导系列(二十八)
|
机器学习/深度学习 算法
近似推断|机器学习推导系列(二十七)
近似推断|机器学习推导系列(二十七)
120 0
近似推断|机器学习推导系列(二十七)
|
机器学习/深度学习 算法
配分函数|机器学习推导系列(二十六)
配分函数|机器学习推导系列(二十六)
229 0
配分函数|机器学习推导系列(二十六)
|
机器学习/深度学习
高斯过程回归|机器学习推导系列(二十四)
高斯过程回归|机器学习推导系列(二十四)
459 0
高斯过程回归|机器学习推导系列(二十四)