提升算法有两个问题需要回答:一是每一轮如何改变迅雷数据的权值和概率分布;二是如何将弱分类器组合成一个强分类器。关于第一个问题,AdaBoost的做法是,提高那些被前一轮弱分类器错误分类样本的权值,而降低那些被正确分类样本的权值。所以,没有被正确分类的样本数据,在加大权值后收到后一轮弱分类器的更大关注。关于第二个问题,AdaBoost采取加权多数表决的方法。具体的,加大分类误差率小的弱分类器的权值,使其在表决中起较大的作用,减少分类误差率大的弱分类器的权值,使其在表决中起到较小的作用。
AdaBoost算法描述如下:
这就是基本的算法描述,接下来我们在举个具体的例子来说明这个问题。例子来自于李航的140的AdaBoost的例子。
这个链接有详细的说明,我就不在赘述了。
https://blog.csdn.net/tiandijun/article/details/48036025(说明一下,G3写反了,楼主也说了)
每一个弱分类器我知道是啥,那基分类器咋用呢?参考这个链接
https://blog.csdn.net/px_528/article/details/72963977
然后,我用一张图解释为啥能分类正确。