GBM和随机森林都是基于树的算法,它们有什么区别?
- RF采用bagging技术做出预测;GBM采用boosting技术做出预测
- bagging技术,数据集采用bootstrap随机采样的方法被划分为n个样本,对多棵树的结果进行加权或者取平均;boosting在第一轮预测之后,增加分类出错的样本权重,减小错误率高的基学习器(树)的权重,持续进行,一直到达停止标准。
- RF采用减小方差提高模型精度,生成树之间没有相关性;GBM在提高精度的同时降低了偏差和方差,某一个基学习器是以上一个基学习器的结果为基础,基学习器之间具有相关性。