《中国人工智能学会通讯》——9.12 集成学习中的挑战性问题及解决方法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第9章,第9.12节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

9.12 集成学习中的挑战性问题及解决方法

然而,传统的集成学习算法,特别是聚类集成算法,在集成器成员选择、聚类结果融合、集成器参数优化等方面还存在一些亟待解决的科学问题(见图 4): ① 集成器存在冗余成员,影响集成的最终结果;② 聚类集成算法集成器中多个聚类结果的融合质量有待进一步提高;③ 没有考虑到集成器参数往往受到外在环境(如样本空间和属性空间)和内在环境(如集成器基础模型的参数和权重)的影响。image
Yu et al [17] 针对上述科学问题,围绕“集成学习理论与应用”,从集成器成员选择、聚类结果融合、集成器参数优化等方面开展创新性研究,研究工作的整体框架如图 4 所示,并取得了一系列的创新成果,包括渐进式集成框架(成果 1)、基于图论的聚类集成框架(成果2)和自适应集成框架(成果3)。

第一,在集成器成员生成阶段,集成框架采用不同的数据映射技术来生成集成器中的一组成员,这组成员之间的差异性越大越好。然而并非所有的集成器成员都对最终结果有贡献。因此,需要研究如何生成一个合适的集成器,如何移除集成器中的冗余成员,使之能够增加集成器的多样性,并提升集成框架的性能。

为了解决集成器中冗余成员的移除问题,提出了渐进式集成框架,并设计了基于全局和局部代价函数的渐进式集成器成员选择过程,有效移除集成器中的冗余成员,增加了集成器的多样性。实验证明,新算法显著优于多种经典的集成算法。Yu etal [17] 考虑专家知识的影响,把专家提供的先验知识转化为约束条件,引入约束传播算法来加以利用,提出了渐进式半监督聚类集成框架。他们还结合子空间学习技术,提出了渐进式的子空间集成框架[18] ;此外,以渐进式集成框架为基础,把聚类集成扩展到聚类结构集成[19- 21] 。

第二,在聚类集成算法的聚类结果融合阶段,需要考虑如何对多个聚类结果进行融合,从而获得一个更好的综合聚类结果。然而,与分类集成算法不同,聚类集成算法的集成器中聚类结果的类的对应关系复杂,见图 5。首先,类的数量不一样,聚类结果1和2包含3个类,而聚类结果3包含4个类;其次,类类之间不是对应关系,如聚类结果 1 的类 2并不对应聚类结果 2 的类 2,而是类 3。传统的适用于分类集成算法的投票机制并不起作用 , 因此,需要设计新的一致性函数来对多个聚类结果进行融合。
image

为了解决集成器中多个聚类结果融合的问题,Yu et al [22- 26] 提出了基于图论和随机子空间的聚类集成算法,引入随机子空间技术处理高维数据,构造一致性矩阵,利用图论规范切算法构造一致性函数,对一致性矩阵进行分割,提高聚类结果融合的质量,提升了聚类集成算法在高维带噪音数据处理上的性能。在基于随机子空间和图论的聚类集成算法的基础上,Yu et al [27-28] 还引入模糊理论,充分考虑硬聚类和软聚类的有机结合,并选择互为补充的基础聚类算法,提出了多种混合模糊聚类集成框架。

第三,集成学习模型的性能往往受到外在环境(如样本空间和属性空间)和内在环境(基本分类器的参数和基本分类器的权重)的影响。但是传统的集成学习模型没有考虑到这些因素的综合影响,没有考虑到如何寻找最优的集成学习模型。而多角度自适应集成学习模型[29] ,不但能够考虑到集成模型的内在环境,而且能够把握集成模型和外在环境之间的关系。自适应集成模型之间会根据解决问题的需要进行一定的信息交互,不断地进行调整,直到达到最佳的状态。多角度自适应集成学习模型将在传统集成学习模型的基础上,从多个不同角度加入自适应学习过程,从而获取最优化的集成学习模型。

为了解决集成器的优化问题,提出了自适应集成框架 , 引入演化计算思想和多智能体理论,把集成器中每个成员看作一个智能体,运用演化计算思想,对集成器及其成员进行优化,从而提升集成器的整体性能[29-32] 。

第四,集成学习算法可应用于带噪音高维数据的挖掘中,比如生物信息数据挖掘和多媒体数据智能处理上,既扩展了集成学习算法的应用领域,又为生物信息数据和多媒体数据的有效处理提供了新的算法支撑。

相关文章
|
机器学习/深度学习 人工智能 算法
普通人怎么学人工智能?这些隐藏学习秘籍大揭秘,生成式人工智能认证(GAI认证)来助力
在人工智能(AI)快速发展的今天,普通人学习AI已成为必然趋势。本文从明确学习目标与路径、利用多元化资源、注重实践应用、关注GAI认证及持续自我提升五个方面,为普通人提供系统化的AI学习指南。通过设定目标、学习编程语言、参与项目实践和获取专业认证,普通人可逐步掌握AI技能,在未来职场中占据优势并开启智能时代新篇章。
1030 11
|
人工智能 算法 安全
深度:善用人工智能推动高等教育学习、教学与治理的深层变革
本文探讨人工智能技术与高等教育深度融合带来的系统性变革,从学习进化、教学革新与治理重构三个维度展开。生成式AI作为技术前沿代表,正通过标准化认证体系(如培生的Generative AI Foundations)提升职场人士、教育者及学生的能力。文章强调批判性思维、高阶认知能力与社交能力的培养,主张教师从经验主导转向数据驱动的教学模式,并提出构建分布式治理结构以适应技术迭代,最终实现人机协同的教育新生态,推动高等教育在智能时代焕发人性光辉。
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
986 3
|
数据采集 人工智能 缓存
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
345 1
|
测试技术
软件质量保护与测试(第2版)学习总结第十三章 集成测试
本文是《软件质量保护与测试》(第2版)第十三章的学习总结,介绍了集成测试的概念、主要任务、测试层次与原则,以及集成测试的不同策略,包括非渐增式集成和渐增式集成(自顶向下和自底向上),并通过图示详细解释了集成测试的过程。
397 1
软件质量保护与测试(第2版)学习总结第十三章 集成测试
|
人工智能 搜索推荐 语音技术
人工智能与未来教育:重塑学习方式的双刃剑
在21世纪,人工智能(AI)技术正以前所未有的速度发展,深刻影响着社会的各个方面,其中包括教育领域。本文探讨了AI如何改变传统教育模式,提出其既带来积极影响也伴随着挑战的观点。通过分析具体案例和数据,文章旨在启发读者思考如何在保留人类教师不可替代价值的同时,有效利用AI技术优化教育体验。
|
人工智能 自然语言处理 搜索推荐
人工智能与教育:个性化学习的未来
【10月更文挑战第31天】在科技飞速发展的今天,人工智能(AI)正深刻改变教育领域,尤其是个性化学习的兴起。本文探讨了AI如何通过智能分析、个性化推荐、智能辅导和虚拟现实技术推动个性化学习,分析了其带来的机遇与挑战,并展望了未来的发展前景。
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与未来教育:重塑学习体验
【10月更文挑战第20天】 在21世纪的今天,人工智能(AI)技术正以前所未有的速度改变着我们的生活、工作和学习方式。本文探讨了AI如何深刻影响未来教育的各个方面,从个性化学习路径的设计到智能辅导系统的开发,再到虚拟现实(VR)和增强现实(AR)技术在学习中的应用。通过分析这些变革,我们不仅能够预见一个更加高效、互动和包容的教育未来,而且还能理解这一过程中所面临的挑战和机遇。文章强调了持续创新的重要性,并呼吁教育工作者、技术开发者和政策制定者共同努力,以确保技术进步惠及每一个学习者。
418 2
|
前端开发 Java 程序员
springboot 学习十五:Spring Boot 优雅的集成Swagger2、Knife4j
这篇文章是关于如何在Spring Boot项目中集成Swagger2和Knife4j来生成和美化API接口文档的详细教程。
2564 1
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在教育中的创新应用:个性化学习的未来
【9月更文挑战第18天】人工智能在教育中的创新应用正在深刻改变着我们的教学方式和学习体验。从个性化学习方案的制定到智能化辅导与反馈,从多元化学习资源的推荐到自动化评分与智能考试系统,AI技术正在为教育领域带来前所未有的变革。面对这一变革,我们需要以开放和批判的态度拥抱它,共同探索AI时代教育的无限可能,为每一个学习者创造更美好的未来。
1109 12

热门文章

最新文章