香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型

简介: 接下来给大家介绍Random vector functional-link网络,它是一种前馈单层的神经网络,于1992年提出,示意图如下所示,只有一个隐含层。输入层和输出层直接相连可以有效防止网络过拟合。

在学校教学模式中,老师扮演着重要的角色。借鉴老师与学生的师生互动模式,香港科技大学在读博士生张鹏博在他的论文A New Learning Paradigm for Random Vector Functional-Link Network: RVFL+中提出一种基于LUPI 的 random vector functional-link 网络(RVFL+),RVFL+不需要太多的计算硬件以及时间,优势明显。

在近期雷锋网 AI研习社的线上分享会上,他为我们详细解读了A New Learning Paradigm for Random Vector Functional-Link Network: RVFL+这篇论文,介绍了RVFL+和KRVFL+,以及它们的应用。

张鹏博,香港科技大学博士在读,于工程学院工业工程与物流管理系(即统计与运筹学系)从事机器学习的相关研究工作。他的研究兴趣包括机器学习、深度学习、优化、智能系统。 在此之前,他于 2015 年在澳门大学提前获得研究型硕士,并参与优秀毕业答辩,同时担任多个期刊和会议的审稿人。

分享内容:

这次为大家带来我最近的研究成果A New Learning Paradigm for Random Vector Functional-Link Network: RVFL+,主要是分享我的思路,为什么这么做以及具体的应用情况。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

我会先介绍这种新型的训练方式Learning using privileged information(LUPI)与传统的不同点。然后介绍之前的主要网络RVLF以及当前流行的随机性算法,之后会介绍新的两种算法RVFL+和KRVFL+。我也给出了一些实验来验证这个方法的表现,还会为大家带来一些未来的可能应用。

香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

在学习中师生互动模式很重要,Learning using privileged information(LUPI)是在机器学习中借鉴了这种模式,来训练我们的机器学习模型。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

LUPI第一次提出是在2009年的一篇论文里用来训练SVM,与传统学习模式的不同是在训练阶段,传统的模式由xi和yi组成,xi是指训练集中的feature,yi是label。新型训练方式中训练集中增加了一项,表示额外信息,类似于学习中老师给我们的信息一样。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

下面给出了SVM和SVM+这两种方法的主形式,如果大家熟悉机器学习,那么SVM的形式应该会很熟悉,SVM+与SVM的不同是多引入了一个参数,如公式所示。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

接下来给大家介绍Random vector functional-link网络,它是一种前馈单层的神经网络,于1992年提出,示意图如下所示,只有一个隐含层。输入层和输出层直接相连可以有效防止网络过拟合。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

为什么RVFL网络很简单,但是工作得很好?下图中是一些解释文献。我们希望训练数据中,同类之间角度小,不同的类之间角度大。RVFL网络是用混合的模式来训练所有网络。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

在当今大数据的时代,对于计算的能力要求非常高,这种混合的训练策略计算花费非常便宜,在未来也是研究的热点。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

简单介绍几个当前流行的随机方法:前三个Random projection、Random forests、Bagging是十多年前提出来的,大家对于这三个并不陌生。我会主要介绍随机神经网络,有兴趣的同学可以看下我在最后列出的参考文献。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

接下来为大家介绍新的RVFL+方法,RVFL网络可以写成如下所示:

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

我们引进了LUPI这种新型的训练方式来训练我们的RVFL网络:

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

下一步构建拉格朗日方程,感兴趣的同学可以在论文里看到如何详细的得到输出权重的整个过程。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

接下来看一下RVFL+的伪码,下面是详细的输入输出。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

我们不仅提出了RVFL+,也提出了它的kernel版本——KRVFL+,这是为了更好的处理非线性问题。KRVFL+相比于RVFL+有两个主要的优势,一是不需要考虑增强节点的个数,二是消除了RVFL+的不稳定性。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

感兴趣的同行可以在我的论文里看到KRVFL+的具体方程,在这里就不具体列出来了,简单给大家介绍一下KRVFL+的伪码,如下所示,它与RVFL+比较相似。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

现在分析RVFL+的一些统计特征,主要是基于Rademacher复杂性。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

现在看实验,我们在14个数据集上评估了模型的效果,包括1个二项分类数据集,8个多项分类数据集和5个回归数据集,今天的讲座里我给大家分享二项分类数据集的实验。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

看一下实验结果,可以看到KRVFL+可以获得93.71%的准确度,训练时间只用了0.005s,在所有模型里面是最快的。RVFL+虽然相比高斯kernel的准确度不高,但相比线性kernel还是有很明显的优势。RVFL+不需要太多的计算硬件以及时间。

 香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

RVFL+和KRVFL+有如下实际应用,后期大家可以进行相关探索。 

香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

在此提出感谢:

香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

我的引用文献如下:

香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结

香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型 | 分享总结




本文作者:Non
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
2天前
|
机器学习/深度学习 监控 算法
LabVIEW使用机器学习分类模型探索基于技能课程的学习
LabVIEW使用机器学习分类模型探索基于技能课程的学习
|
3天前
|
机器学习/深度学习 数据采集
构建高效机器学习模型的最佳实践
【5月更文挑战第11天】 在数据驱动的时代背景下,机器学习已经成为企业与研究者解决复杂问题的重要工具。本文将探讨构建高效机器学习模型的关键步骤,包括数据预处理、特征工程、模型选择与调参、以及性能评估。我们将深入分析这些步骤的重要性,并提供实用的技巧和最佳实践,以助读者提高模型的预测能力与泛化性能。通过案例分析和经验总结,本文旨在为从业者提供一套系统的方法论,帮助他们在面对各种机器学习项目时能够更有效地设计和实现解决方案。
4 0
|
3天前
|
机器学习/深度学习 存储 算法
【机器学习】使用贝叶斯模型做分类时,可能会碰到什么问题?怎么解决?
【5月更文挑战第11天】【机器学习】使用贝叶斯模型做分类时,可能会碰到什么问题?怎么解决?
|
3天前
|
机器学习/深度学习
【机器学习】噪声数据对贝叶斯模型有什么样的影响?
【5月更文挑战第10天】【机器学习】噪声数据对贝叶斯模型有什么样的影响?
|
3天前
|
机器学习/深度学习 数据处理
【机器学习】生成式模型与判别式模型有什么区别?
【5月更文挑战第10天】【机器学习】生成式模型与判别式模型有什么区别?
|
3天前
|
机器学习/深度学习
【机器学习】如何根据训练集大小选择分类器?
【5月更文挑战第10天】【机器学习】如何根据训练集大小选择分类器?
|
3天前
|
机器学习/深度学习 人工智能 算法
高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型
随着高通量测序技术的飞速发展和多组学分析的广泛应用,科研人员在探索生物学奥秘时经常遇到一个令人又爱又恼的问题:如何从浩如烟海的数据中挖掘出潜在的疾病关联靶点?又如何构建一个全面而有效的诊断或预后模型?只有通过优雅的数据挖掘、精致的结果展示、深入的讨论分析,并且辅以充分的湿实验验证,我们才能锻造出一篇兼具深度与广度的“干湿结合”佳作。
15 0
高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型
|
4天前
|
机器学习/深度学习 数据采集 监控
构建高效机器学习模型的最佳实践
【5月更文挑战第10天】 在面对海量数据和复杂问题时,构建一个既高效又准确的机器学习模型显得至关重要。本文将探讨一系列实用的技术和策略,旨在帮助数据科学家和工程师优化他们的机器学习工作流程。从数据预处理到模型训练,再到最终的评估与部署,我们将深入讨论如何通过最佳实践提升模型性能,同时确保过程的可复现性和可扩展性。
|
4天前
|
机器学习/深度学习 数据采集 监控
构建高效机器学习模型的五大技巧
【5月更文挑战第10天】 在数据驱动的时代,机器学习模型的性能往往决定了一个项目的成败。本文将深入探讨如何通过五个关键步骤——数据预处理、特征工程、模型选择、超参数调优以及模型评估与部署,来构建一个高效的机器学习模型。我们将提供实用的技术细节和策略,帮助读者避免常见的陷阱,并提升模型的准确性和泛化能力。无论你是机器学习新手还是有经验的开发者,本文的技巧都将对你构建更健壮、高效的模型大有裨益。
|
5天前
|
机器学习/深度学习 算法 异构计算
构建高效机器学习模型的策略与实践
【5月更文挑战第8天】 随着数据科学领域的不断进步,机器学习(ML)已成为解决复杂问题的重要工具。然而,构建一个既高效又准确的ML模型并非易事。本文将详细探讨在设计和训练机器学习模型时可以采用的一系列策略,以优化其性能和效率。我们将讨论特征工程的重要性、选择合适的算法、调整参数以及评估模型的有效性。通过这些策略,读者将能够更好地理解如何提升模型的预测能力并避免常见的陷阱。