其他学习算法| 学习笔记

简介: 快速学习其他学习算法

开发者学堂课程【机器学习概览及常见算法其他学习算法】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/529/detail/7125?spm=a2c6h.21258778.0.0.28017ecfLiHgBb


其他学习算法

 

内容简介:


1 半监督学习

2 集成学习

3 Bagging

4 Boosting

5 AdaBoost

6 随机森林: RandomForest

7 深度学习

8 增强学习: Reinforcement Learning

9 迁移学习: Transfer Learning

 

 

1 半监督学习

半监督学习:训练数据有部分被标识,部分没有被标识,这种模型首先需要学习数据的内在结构,以便合理的组织数据来进行预测。旨在避免数据和资源的浪费,解决监督学习模型泛化能力不强、无监督学习的模型不精确等问题。

常见学习方法:

■半监督分类 : 在无类标签的样例的帮助下训练有类标签的样

本,弥补有类标签的样本不足的缺陷

■半监督回归 :在无输出的输入的帮助下训练有输出的输入,

获得性能更好的回归器

■半监督聚类 : 在有类标签的样本的信息帮助下获得比只用无

类标签的样例得到的结果更好的簇

■半监督降维 :在有类标签的样本的信息帮助下找到高维输入

数据的低维结构,同时保持原始高维数据和成对约束的结构不

 

 

2 集成学习

集成学习: 针对同一数据集,训练多种学习器,来解决同一问题

■Bagging :

V有放回抽样构建多个子集

V训练多个分类器

V最终结果由各分类器结果投票得出

V实现非常简单

■Boosting

V重复使用一类学习器来修改训练集

v每次训练后根据结果调整样本的权重

V每个学习器加权后的线性组合即为最终结果

■Stacking

V由两级组成,第- -级为初级学习器,第级为高级学习器

V第一级学习器的输出作为第二级学习器的输入

 

3 Bagging

图片1钱钱1.png

 

4 Boosting

图片1钱.png

5 AdaBoost


6 随机森林: RandomForest

随机森林( RandomForest )

■由许多决策树组成,树生成时采用了随机的方

. Smart Bagging

■生成步骤

V随机采样,生成多个样本集

V对每个样本集构建决策树

■优点:

V可以处理多分类

V不会过拟合

V容易实现并行

V对数据集容错能力强

 

 

7 深度学习

深度学习:深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

属于机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本

常见深度学习算法:

■受限波尔兹曼机 Restricted Boltzmann Machine ( RBM )

■深度信念网络 Deep Belief Networks ( DBN )

■卷积网络 Convolutional Network

■栈式自编码 Stacked Auto- encoders

 

 

8 增强学习: Reinforcement Learning

增强学习要解决的问题是:一个能感知环境的自治agent,通过学习, 选择能达到其目标的最优动作。

本质就是解决"决策(decision making)"问题,即学会自动进行决策比如控制移动器人、在工厂中学习最优操作工序、学习棋类对弈等。

常见增强学习算法:

Q-Learning

时间差学习Temporal difference learning

 

 

9 迁移学习: Transfer Learning

迁移学习是要把已学训练好的模型参数迁移到新的模型来帮助新模型训练数据集。初衷是节省人工标注

样本的时间,让模型可以通过已有的标记数据向未标记数据迁移。换言之,就是运用已有的知识来学习

新的知识,核心是找到已有知识和新知识之间的相似性。

相关文章
|
11天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】关联规则学习:Apriori算法详解
【4月更文挑战第30天】Apriori算法是一种用于关联规则学习的经典算法,尤其适用于购物篮分析,以发现商品间的购买关联。该算法基于支持度和置信度指标,通过迭代生成频繁项集并提取满足阈值的规则。Python中可借助mlxtend库实现Apriori,例如处理购物篮数据,设置支持度和置信度阈值,找出相关规则。
|
11天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】集成学习算法的原理与应用
【4月更文挑战第30天】集成学习通过组合多个基学习器提升预测准确性,广泛应用于分类、回归等问题。主要步骤包括生成基学习器、训练和结合预测结果。算法类型有Bagging(如随机森林)、Boosting(如AdaBoost)和Stacking。Python中可使用scikit-learn实现,如示例代码展示的随机森林分类。集成学习能降低模型方差,缓解过拟合,提高预测性能。
|
24天前
|
机器学习/深度学习 算法 前端开发
Scikit-learn进阶:探索集成学习算法
【4月更文挑战第17天】本文介绍了Scikit-learn中的集成学习算法,包括Bagging(如RandomForest)、Boosting(AdaBoost、GradientBoosting)和Stacking。通过结合多个学习器,集成学习能提高模型性能,减少偏差和方差。文中展示了如何使用Scikit-learn实现这些算法,并提供示例代码,帮助读者理解和应用集成学习提升模型预测准确性。
|
24天前
|
机器学习/深度学习 算法 Python
使用Python实现集成学习算法:Bagging与Boosting
使用Python实现集成学习算法:Bagging与Boosting
22 0
|
25天前
|
算法 安全 数据可视化
python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析
python关联规则学习:FP-Growth算法对药品进行“菜篮子”分析
|
1月前
|
算法
【算法学习--字符串】(不含KMP算法)
【算法学习--字符串】(不含KMP算法)
|
2月前
|
机器学习/深度学习 算法 数据挖掘
什么是集成学习算法
什么是集成学习算法
36 0
|
1天前
|
算法 数据安全/隐私保护 计算机视觉
基于二维CS-SCHT变换和LABS方法的水印嵌入和提取算法matlab仿真
该内容包括一个算法的运行展示和详细步骤,使用了MATLAB2022a。算法涉及水印嵌入和提取,利用LAB色彩空间可能用于隐藏水印。水印通过二维CS-SCHT变换、低频系数处理和特定解码策略来提取。代码段展示了水印置乱、图像处理(如噪声、旋转、剪切等攻击)以及水印的逆置乱和提取过程。最后,计算并保存了比特率,用于评估水印的稳健性。
|
2天前
|
存储 算法 数据可视化
基于harris角点和RANSAC算法的图像拼接matlab仿真
本文介绍了使用MATLAB2022a进行图像拼接的流程,涉及Harris角点检测和RANSAC算法。Harris角点检测寻找图像中局部曲率变化显著的点,RANSAC则用于排除噪声和异常点,找到最佳匹配。核心程序包括自定义的Harris角点计算函数,RANSAC参数设置,以及匹配点的可视化和仿射变换矩阵计算,最终生成全景图像。
|
2天前
|
算法 Serverless
m基于遗传优化的LDPC码NMS译码算法最优归一化参数计算和误码率matlab仿真
MATLAB 2022a仿真实现了遗传优化的归一化最小和(NMS)译码算法,应用于低密度奇偶校验(LDPC)码。结果显示了遗传优化的迭代过程和误码率对比。遗传算法通过选择、交叉和变异操作寻找最佳归一化因子,以提升NMS译码性能。核心程序包括迭代优化、目标函数计算及性能绘图。最终,展示了SNR与误码率的关系,并保存了关键数据。
11 1