干货 | Python人工智能在贪吃蛇游戏中的应用探索（上）（一）-阿里云开发者社区

干货 | Python人工智能在贪吃蛇游戏中的应用探索（上）（一）

2022-04-23 483

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 干货 | Python人工智能在贪吃蛇游戏中的应用探索（上）

前言

一个月前，人工智能对我来说都是很陌生的，更不用说神经网络、强化学习、DQN等名词了。疫情期间，经过在家努力学习，我对这些概念越来越清晰了，也越来越喜欢上了它们。微信图片_20220423105924.gif

下面，我想写一些收获，希望能给同样想在这方面学习的小伙伴一点启发，也欢迎大家指教，一起进步哦。今天的内容主要有以下几方面：

后续我将分三篇来进行该主题的分享，让我们开始吧！

神经网络原本指的是生物神经网络，人工智能兴起后，产生了人工神经网络（artificial neural network，缩写ANN）。人的神经接受信息以后，通过轴突传至末梢，转化成一种人可接受的信息。

而ANN是指由大量的处理单元(神经元) 互相连接而形成的复杂网络结构，是对人脑组织结构和运行机制的某种抽象、简化和模拟，以数学模型模拟神经元活动，是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。

微信图片_20220423105927.png 生物神经网络图

神经网络主要由：输入层、隐藏层、输出层构成。如图，最左边的一层称为输入层，位于这一层的神经元称为输入神经元。最右边的输出层包含了输出神经元。中间的层被称为隐藏层。隐藏层就是既不是输入也不是输出的层次，一个神经网络可以有一个或多个隐藏层。

微信图片_20220423105929.jpg 神经网络构成

网络中的输入和输出层一般都被设计的很简单。网络输入层的每个神经元代表了一个特征，输出层个数代表了分类标签的个数。而隐藏层的设计比较复杂，隐藏层作用很大，就其本身而言，每一层都可以视为一个单独的机器学习算法。

每个隐藏层神经元/输出层神经元的值（激活值），都是由上一层神经元，经过加权求和与非线性变换而得到的。上游层的输出被用作输入，它的输出被传递到下一层，然后下一层使用该输出作为输入，依此类推。

此行为意味着，当堆叠各种层和创建深度神经网络时，系统会学习数据的中间表示，以帮助下游层更有效地完成其工作。现在，神经网络的研究人员已经开发了隐藏层的许多的最优设计规则，帮助我们决定如何权衡网络的隐藏层数和训练网络所需的时间。

总结：建立神经网络的方法：建立M个隐藏层，按顺序建立输入层跟隐藏层的联结，最后建立隐藏层跟输出层的联结。为每个隐藏层的每个节点选择激活函数。求解每个联结的权重和每个节点自带的bias值。

下面重点描述下神经网络中的概念。

结构：结构指定了网络中的变量和它们的拓扑关系。例如，神经网络中的变量可以是神经元连接的权重和神经元的激励值。激活函数（激励函数）与权重

权重：通俗来讲就是各个变量在计算中所占比重。举个简单的例子，大学的每一门科目都有相应的学分，这个学分意味着在加权时所占的比重，我们假设哲学占5学分，数学3学分，就有得到值A。在神经元中，这个值会被带入激活函数进一步处理。

此处还涉及到偏值b，其大概相当于一次函数的截距，我们通过b来适当控制值的范围。常见激活函数如下：

微信图片_20220423105932.png 激活函数

损失函数：如下公式，此处为得到的输出值，则是期望值，当函数值趋于零，就得到了理想的输出值（不一定是最好的）。从数学的角度来讲，我们写出的损失函数，在输出值趋于期望时，函数值要尽可能快的趋于零，如果在绝对值外添加次方，即可达到这一效果。

根据损失函数的大小，我们以此来调整权重和偏值，寻找最优解。

学习规则：指定了网络中的权重如何随着时间推进而调整。一般情况下，学习规则依赖于神经元的激励值。它也可能依赖于监督者提供的目标值和当前权重的值。