台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization-阿里云开发者社区

台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

2021-12-17 162

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 上一节课，我们主要探讨了当M的数值大小对机器学习的影响。

上一节课，我们主要探讨了当M的数值大小对机器学习的影响。如果M很大，那么就不能保证机器学习有很好的泛化能力，所以问题转换为验证M有限，即最好是按照多项式成长。然后通过引入了成长函数mH(N)和dichotomy以及break point的概念，提出2D perceptrons的成长函数mH(N)是多项式级别的猜想。这就是本节课将要深入探讨和证明的内容。

一、Restriction of Break Point

我们先回顾一下上节课的内容，四种成长函数与break point的关系：

下面引入一个例子，如果k=2，那么当N取不同值的时候，计算其成长函数mH(N)是多少。很明显，当N=1时，mH(N)=2,；当N=2时，由break point为2可知，任意两点都不能被shattered（shatter的意思是对N个点，能够分解为2N种dichotomies）；mH(N)最大值只能是3；当N=3时，简单绘图分析可得其mH(N)=4，即最多只有4种dichotomies。

所以，我们发现当N>k时，break point限制了mH(N)值的大小，也就是说影响成长函数mH(N)的因素主要有两个：

那么，如果给定N和k，能够证明其mH(N)的最大值的上界是多项式的，则根据霍夫丁不等式，就能用mH(N)代替M，得到机器学习是可行的。所以，证明mH(N)的上界是poly(N)，是我们的目标。

二、Bounding Function: Basic Cases

现在，我们引入一个新的函数：bounding function，B(N,k)。Bound Function指的是当break point为k的时候，成长函数mH(N)可能的最大值。也就是说B(N,k)是mH(N)的上界，对应mH(N)最多有多少种dichotomy。那么，我们新的目标就是证明：

这里值得一提的是，B(N,k)的引入不考虑是1D postive intrervals问题还是2D perceptrons问题，而只关心成长函数的上界是多少，从而简化了问题的复杂度。

三、Bounding Function: Inductive Cases

N > k的情况较为复杂，下面给出推导过程：

以B(4,3)为例，首先想着能否构建B(4,3)与B(3,x)之间的关系。

首先，把B(4,3)所有情况写下来，共有11组。也就是说再加一种dichotomy，任意三点都能被shattered，11是极限。

对这11种dichotomy分组，目前分成两组，分别是orange和purple，orange的特点是，x1,x2和x3是一致的，x4不同并成对，例如1和5，2和8等，purple则是单一的，x1,x2,x3都不同，如6,7,9三组。

将Orange去掉x4后去重得到4个不同的vector并成为α，相应的purple为β。那么B(4,3)=2α+β，这个是直接转化。紧接着，由定义，B(4,3)是不能允许任意三点shatter的，所以由α和β构成的所有三点组合也不能shatter（alpha经过去重），即α+β≤B(3,3)。

另一方面，由于α中x4是成对存在的，且α是不能被任意三点shatter的，则能推导出α是不能被任意两点shatter的。这是因为，如果α是不能被任意两点shatter，而x4又是成对存在的，那么x1、x2、x3、x4组成的α必然能被三个点shatter。这就违背了条件的设定。这个地方的推导非常巧妙，也解释了为什么会这样分组。此处得到的结论是α≤B(3,2)

上述不等式的右边是最高阶为k-1的N多项式，也就是说成长函数mH(N)的上界B(N,K)的上界满足多项式分布poly(N)，这就是我们想要得到的结果。

得到了mH(N)的上界B(N,K)的上界满足多项式分布poly(N)后，我们回过头来看看之前介绍的几种类型它们的mH(N)与break point的关系：

四、A Pictorial Proof

我们已经知道了成长函数的上界是poly(N)的，下一步，如果能将mH(N)代替M，代入到Hoffding不等式中，就能得到Eout≈Ein的结论：

这部分内容，我也只能听个大概内容，对具体的证明过程有兴趣的童鞋可以自行研究一下，研究的结果记得告诉一下我哦。

最终，我们通过引入成长函数mH，得到了一个新的不等式，称为Vapnik-Chervonenkis(VC) bound：

五、总结

本节课我们主要介绍了只要存在break point，那么其成长函数mH(N)就满足poly(N)。推导过程是先引入mH(N)的上界B(N,k)，B(N,k)的上界是N的k-1阶多项式，从而得到mH(N)的上界就是N的k-1阶多项式。然后，我们通过简单的三步证明，将mH(N)代入了Hoffding不等式中，推导出了Vapnik-Chervonenkis(VC) bound，最终证明了只要break point存在，那么机器学习就是可行的。

台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

一、Restriction of Break Point

二、Bounding Function: Basic Cases

三、Bounding Function: Inductive Cases

四、A Pictorial Proof

五、总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

一、Restriction of Break Point

二、Bounding Function: Basic Cases

三、Bounding Function: Inductive Cases

四、A Pictorial Proof

五、总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景