深度之眼（二十三）——Python：Sklearn库(下）-阿里云开发者社区

深度之眼（二十三）——Python：Sklearn库(下）

2023-01-31 135

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 深度之眼（二十三）——Python：Sklearn库(下）

2.3 决策树

[1]基本思想

CART算法:每次通过一个特征，将数据尽可能的分为纯净的两类,递归的分下去

如果全部分开，会过拟合

可视化

2.4 逻辑回归

[1]基本思想

一种解释:

训练:通过一个映射方式,将特征X= (x1, x2)映射成P(y=ck),求使得所有概率之积最大化的映射方式里的参数

预测:计算p(y=ck) 取概率最大的那个类别作为预测对象的分类

2.5 支持向量机

[1]基本思想

以二分类为例，假设数据可用完全分开:

用一个超平面将两类数据完全分开，且最近点到平面的距离最大

2.6 集成方法

2.6.1 随机森林

[1]基本思想

训练集m,有放回的随机抽取m个数据,构成一组，共抽取n组采样集

n组采样集训练得到n个弱分类器弱分类器-般用决策树或神经网络

将n个弱分类器进行组合得到强分类器

方法跟上面一样

2.6.2 Adaboost

[1]基本思想

训练集m,用初始数据权重训练得到第一个弱分类器，根据误差率计算弱分类器系数，更新数据的权重

使用新的权重训练得到第二个弱分类器，以此类推

根据各自系数，将所有弱分类器加权求和获得强分类器

2.6.3 梯度提升树GBDT

[1]基本思想

训练集m,获得第一个弱分类歇，获得残差，然后不断地拟合残差

所有弱分类器相加得到强分类器

三、大杀器

[1] xgboost

GBDT的损失函数只对误差部分做负梯度(- -阶泰勒)展开

XGBoost损失函数对误差部分做二阶泰勒展开,更加准确，更快收敛

[2] lightgbm

微软:快速的，分布式的，高性能的基于决策树算法的梯度提升框架

速度更快

[3] stacking

堆叠或者叫模型融合

先建立几个简单的模型进行训练，第二级学习器会基于前级模型的预测结果进行再训练

[4]神经网络

自己看看网络文章吧

深度之眼（二十三）——Python：Sklearn库(下）

2.3 决策树

2.4 逻辑回归

2.5 支持向量机

2.6 集成方法

2.6.1 随机森林

2.6.2 Adaboost

2.6.3 梯度提升树GBDT

三、大杀器

四、总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

深度之眼（二十三）——Python：Sklearn库(下）

2.3 决策树

2.4 逻辑回归

2.5 支持向量机

2.6 集成方法

2.6.1 随机森林

2.6.2 Adaboost

2.6.3 梯度提升树GBDT

三、大杀器

四、总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像