教机器写代码:增强拓扑进化网络(NEAT)

简介: NEAT的意思是“增强拓扑进化网络”,它描述了在进化过程中受遗传修饰启发的自学习机器的算法概念,不妨看看它是如何教机器写代码的。

教机器写代码:增强拓扑进化网络(NEAT)

1.gif

在这篇文章中,我将向大家介绍一种名为增强拓扑进化网络(NEAT)的机器学习方法。

介绍

我喜欢学习。每当遇到从未接触过的书籍或论文,并开始阅读的时候,我都会感到非常兴奋。有些人喜欢在空闲时间玩填字游戏、数独或者猜谜语,以刺激自己的意识。而我喜欢阅读论文并尝试实现文中所提到的算法。而且,由于喜欢学习,我一直对自己无法学到所有想要学的东西而感到难过。我特别感兴趣的是学习如何让电脑为我而学习,让电脑为我提供一些有趣的信息,从而最大限度地提高学习的效率和有效性。这些用于构建复杂信息的算法属于“专家系统”这个领域。因此,我的目标就是“创造”一个“专家”,在需要做决定的时候可以向他咨询。让我们来看一下这个被称为NEAT的“专家”模型吧,本文将介绍有关这方面的一些概念。在以后的文章中,我可能会给出一些实现代码。

什么是NEAT?

NEAT的意思是“增强拓扑进化网络”,它描述了在进化过程中受遗传修饰启发的自学习机器的算法概念。

2.gif

生活本身非常迷人。每当我观察大自然的时候,我都会去关注所有生物的共同点,也就是信息。信息似乎是繁殖的核心遗产。大自然能够对过去37亿年的信息传递进行优化,并创造出各种不同的物种。查尔斯·达尔文有关适者生存的概念让我们理解了是什么使得一些物种能够生存,而其他物种只能灭亡的。进化计算机科学家的目标是通过模仿自然进化来构建系统解决复杂问题。

描述NEAT原理最简单的方法就是举例子。如果你打算设计一个能以最优方式玩游戏的专家系统,那么你需要考虑哪些相关的因素呢?

首先,定义“玩家”所有可执行的动作。例如,超级马里奥能够跳、躲避、向左走、向右走、旋转、快跑等等。如果我们将机器与这些变量相关联,并允许机器执行这些动作,那么机器才有可能完成某件事。

其次,为计算机定义一个目标。这里要引入“适应度评分”这个概念。适应度评分是一个对成功进行奖励的数学函数。在像马里奥这样的游戏中,适应度评分表示了玩家迈向终点线的进度。 适应度评分函数中可以包含很多的变量,如收集到的硬币、被击败的敌人或整体完成时间。

第三,定义进化规则。 NEAT允许节点的突变、节点之间的新连接,以及通过产生后代来继承父辈。此外,NEAT能够确保不同种类的“物种”之间共存,直到他们被允许相互竞争,产生新的更优的后代。为了确保适者生存,已经尝试过的网络在未来不会重试,而现有的网络可以自我优化,NEAT会为每一个作为历史标记的基因添加一个创新数字。

3.png

上图显示了添加节点和添加连接这两种突变。在图的上半部分,2到4的连接被禁用了,取而代之的是新创建了一个从3到5的连接。在下半部分的节点突变中可以看到2到4的连接被禁用了,新引入了节点6,并创建了3到6和6到4这两个新的连接。

4.png

上图展示了进化是如何发生的。父辈1和父辈2在节点和连接上有相似点,但它们之间也存在区别。该机器使用二元逻辑来包含或者排除一个节点/连接。基本的判断机制是:true与true得true,true与false得false,false与false得false。这样就确保了后代继承过来的信息对于适应度评分是有效的,而进化得到的新的节点和连接会出现在后代中,如果在父节点中是禁用的,则后代中也是禁用的。“匹配基因是随机遗传的,而不相交的基因(中间不匹配的基因)和多余的基因(最终不匹配的基因)会从更合适的父辈那继承。在这种情况下,假设适应度相等,不相交和多余的基因也会随机遗传。禁用的基因可能会在后代中再次启用:如果一个遗传基因在双亲中被禁用,那么它就有可能被遗传的基因所禁用。”[Stanley,Miikkulainen,第109页,NEAT]

现在,一切都清楚了,NEAT可以通过迭代和进化新的神经网络来达到最佳的适应度评分,这可在游戏上实现。我强烈推荐这篇论文,它写得非常好,初学者也可以理解。但是如果你想要快速入门的话,可以在YouTube上观看这个精彩的视频:https://youtu.be/qv6UVOQ0F44(需科学上网)

NEAT能很好地解决复杂的问题,因为它可以把大问题分解为多个可优化的小问题。 NEAT代理可用于多个不同的独立任务,然后将其结合起来解决更复杂的问题。这里有一个利用NEAT发明药品的例子,首先确定好所有需要用到的微量元素,然后定义一个适应度函数,使得模拟系统能够理解奖励制度,最后定义进化规则。而另一个NEAT可用于选择新药品的生产技术。一旦这两个系统结合起来,就能产生一个为成本效益而优化的新的适应度函数,此函数可以为这个新设计的药品创造出最优的生产方法。这虽然在理论上听起来不错,但显然是一项非常复杂任务,需要大量的研究和实验才可能实现。

文章原标题《How do we teach a machine to program itself ? — NEAT learning》,作者:Murat Vurucu,译者:夏天,审校:主题曲。

文章为简译,更为详细的内容,请查看原文

相关文章
|
3月前
|
3月前
|
网络协议 网络架构
用MASM32按Time Protocol(RFC868)协议编写网络对时程序中的一些有用的函数代码
用MASM32按Time Protocol(RFC868)协议编写网络对时程序中的一些有用的函数代码
|
3天前
|
边缘计算 负载均衡 监控
静态代理IP与动态网络拓扑的协同发展
随着科技和互联网的发展,越来越多企业依赖代理服务。静态代理IP与网络拓扑结构的有效融合能显著提升网络性能、安全性和管理效率。通过合理设计网络拓扑、分配静态代理IP,并结合监控和安全策略,可优化数据流、实现负载均衡,确保高效安全的数据传输。未来,云计算、边缘计算及AI技术将进一步推动这一融合,形成更灵活高效的网络架构。
14 1
|
3月前
|
机器学习/深度学习 网络架构 计算机视觉
目标检测笔记(一):不同模型的网络架构介绍和代码
这篇文章介绍了ShuffleNetV2网络架构及其代码实现,包括模型结构、代码细节和不同版本的模型。ShuffleNetV2是一个高效的卷积神经网络,适用于深度学习中的目标检测任务。
132 1
目标检测笔记(一):不同模型的网络架构介绍和代码
|
3月前
|
边缘计算 自动驾驶 5G
5G的网络拓扑结构典型模式
5G的网络拓扑结构典型模式
434 4
|
4月前
|
安全 C#
某网络硬盘网站被植入传播Trojan.DL.Inject.xz等的代码
某网络硬盘网站被植入传播Trojan.DL.Inject.xz等的代码
|
3月前
|
移动开发 网络协议 测试技术
Mininet多数据中心网络拓扑流量带宽实验
Mininet多数据中心网络拓扑流量带宽实验
110 0
完成切换网络+修改网络连接图标提示的代码框架
完成切换网络+修改网络连接图标提示的代码框架
|
5月前
|
开发者 图形学 API
从零起步,深度揭秘:运用Unity引擎及网络编程技术,一步步搭建属于你的实时多人在线对战游戏平台——详尽指南与实战代码解析,带你轻松掌握网络化游戏开发的核心要领与最佳实践路径
【8月更文挑战第31天】构建实时多人对战平台是技术与创意的结合。本文使用成熟的Unity游戏开发引擎,从零开始指导读者搭建简单的实时对战平台。内容涵盖网络架构设计、Unity网络API应用及客户端与服务器通信。首先,创建新项目并选择适合多人游戏的模板,使用推荐的网络传输层。接着,定义基本玩法,如2D多人射击游戏,创建角色预制件并添加Rigidbody2D组件。然后,引入网络身份组件以同步对象状态。通过示例代码展示玩家控制逻辑,包括移动和发射子弹功能。最后,设置服务器端逻辑,处理客户端连接和断开。本文帮助读者掌握构建Unity多人对战平台的核心知识,为进一步开发打下基础。
181 0