特征选取与实例选取的差分进化算法(A Differential Evolution Approach to Feature Selection and Instance Selection)
摘要:由于存储硬件和数据采集技术的不断发展,越来越多数据正被收集。数据的传入流量非常的庞大,以至于数据挖掘技术无法跟上其脚步。收集的数据往往有多余的或不相关的特征/实例,它们会限制分类的性能。特征选取和实例选取是通过消除无用数据来帮忙缓解该问题的过程。本文提出了一系列使用差分进化算法(Differential Evolution )的算法,实现特征选取,实例选取,以及特征选取和实例选取的结合。数据的减少,分类精度和训练时间与原来的数据和现有的算法有的一拼。十个不同难度数据集中的实验研究表明:新发展的算法可以成功的减小数据的规模,而且在大多数情况下可以维持合作增加分级性能。此外,计算时间也有着实质性的减少。本次工作是第一次系统性的,在分级中研究一系列特征/实例选取算法,且结果表明实例选取问题比特征选取问题更难解决,但方法有效的话,就可以大大减小数据的规模并提供巨大的利益。
关键词:差分进化算法·特征选取·实例选取·分级
第一作者简介
Bing Xue
学历:惠灵顿维多利亚大学工程与计算机科学学院博士
研究方向:人工智能,机器学习,大数据/连接生物学,统计,工程和数学的数据库
相关学术论文:
·"A Survey on Evolutionary Computation Approaches to Feature Selection"(IEEE Transaction on Evolutionary Computation .Aug. 2016)
·"Cross-Domain Reuse of Extracted Knowledge in Genetic Programming for Image Classification"(IEEE Transaction on Evolutionary Computation 2016)
via:PRICAI 2016
PS : 本文由雷锋网(公众号:雷锋网)独家编译,未经许可拒绝转载!
本文作者:章敏
本文转自雷锋网禁止二次转载,原文链接