30行代码,带你分分钟创建神经网络!(附工具&教程)

简介:
+关注继续查看

image

本文含大量代码,如需原文请从文末来源链接获取。

自己搭建神经网络太复杂?

image

使用Synaptic.js(https://synaptic.juancazala.com/#/ )创建和训练神经网络。
利用这款工具,我们可以在浏览器中用Node.js进行深度学习。
今天我们要讲的例子是一个非常简单的神经网络,我们将用它来学习逻辑异或方程(XOR equation)。
同时,我也在Scrimba上创建了一个交互式屏幕录像。你也可以通过观看视频来学习本教程。(https://scrimba.com/casts/cast-1980
在开始编程之前,让我们先快速浏览神经网络的一些基本概念。

image

神经网络的第一个模块,是神经元。
神经元类似一个函数,你输入一些值,它就会输出返回值。
神经元有各种不同的类型。我们的神经网络将用到sigmoid神经元(https://en.wikipedia.org/wiki/Sigmoid_function ),它能将任何输入的给定值压缩至0到1之间。
下图中的圆圈就代表一个sigmoid神经元。它的输入值是5,输出值是1。箭头则代表的是神经元的突触,用来连接神经网络中其它层的神经元。

image

为什么会有一个红色的数字5呢?它是连接到神经元的三个突触(左边3个箭头)的值之和。
在最左边,我们看到有两个值与所谓的偏差值进行了加法运算。数值1和0是绿色的,而偏差值-2是棕色的。
首先,两个输入值与他们的权重分别相乘,权重就是蓝色数字7和3。
然后,我们把上述运算结果和偏差值加起来,所得的结果是5,对应红色数字。这个红色数字就是我们人工神经元的输入值。

image

由于我们的神经元是sigmoid神经元,它会将任何值压缩到0到1的区间范围内,所以输出值被压缩到1。
如果将这些神经元的网络连接起来,就形成了一个神经网络。通过神经元间的突触连接,从输入到输出进行正向传播。如下图所示:

image

神经网络的目标是训练其泛化能力,例如识别手写的数字或者垃圾邮件。做到好的泛化重要的是通过神经网络找到合适的权重和偏差值,如上述例子中的蓝色和棕色数字。
当训练神经网络时,我们只需要加载大量示例数据,如手写的数字,然后让神经网络来预测正确的数字。
在每次预测后,你需要计算预测的偏差程度,然后调整权重和偏差值使得神经网络在下一次运算中可以预测的更加准确,这种学习过程被称为反向传播。如此重复上千次,你的神经网络很快会精于泛化。
本教程不包括反向传播的工作原理介绍,但是我找到了3个好的教程帮助大家理解:
分步介绍反向传播案例-作者:Matt Mazur
https://mattmazur.com/2015/03/17/a-step-by-step-backpropagation-example/
神经网路骇客指南-作者:Andrej Karpathy
http://karpathy.github.io/neuralnets/
神经网络和深度学习-作者:Michael Nielsen
http://neuralnetworksanddeeplearning.com/chap1.html

image

现在,你应该已经对神经网络有了基础概念,那就让我们进入代码部分吧。

1.创建神经网络层

在synaptic中我们使用new layer()函数来创建。函数中传递的数字表示的是每一层会有多少个神经元。

image

接下来我们将这些层进行连接并实例化一个神经网络,代码如下,

image

这是一个2-3-1结构的神经网络,可视化表示如下:

image

2.训练神经网络

image

我们共进行了20,000次的训练,每一次都进行四次正向传播和反向传播运算,分别传递四个可能的输入到神经网络:[0,0] [0,1] [1,0] [1,1]。
我们从myNetwork.activate([0,0])激活函数开始,[0,0]是神经网络的输入值,这个过程是正向传播,也被称为激活网络。在每一次正向传播后我们需要做一次反向传播,从而更新神经网络的权重和偏差值。

image

learningRate是一个常数,用来告诉神经网络每次应该对权重值进行多大程度的调整。第二个参数0表示的是当输入为[0,0]时,正确的输出参数是0.
然后,神经网络将预测值和真实值进行对比,来判断预测是否正确。
它将比较的结果作为调整权重和偏差值的基础,以便下次的预测可以更加准确。
在执行这个过程20,000次后,我们可以通过传递四个可能的值输入到激活网络,从而判断目前神经网络的预测情况:

image

如果我们将这些值四舍五入到最近的整数,就将得到异或方程的正确结果。万岁!

image
image

原文发布时间为:2017-09-21
本文作者:Per Haiald Borgen
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 并行计算 计算机视觉
YOLOv5入门实践(5)——从零开始,手把手教你训练自己的目标检测模型(包含pyqt5界面)
YOLOv5入门实践(5)——从零开始,手把手教你训练自己的目标检测模型(包含pyqt5界面)
81 0
YOLOv5入门实践(5)——从零开始,手把手教你训练自己的目标检测模型(包含pyqt5界面)
|
2月前
|
机器学习/深度学习 PyTorch 测试技术
使用PyTorch构建神经网络(详细步骤讲解+注释版) 01-建立分类器类
神经网络中,一个非常经典的案例就是手写数据的识别,本文我们以手写数据识别为例进行讲解。用到的数据是MNIST数据集。MNIST数据集是一个常用的用于计算机视觉的测试数据集,包含了70,000张手写数字的图片,用于训练和测试模型识别手写数字的能力。MNIST数据集中的图片大小都是28x28像素,图片中的数字是黑白的,每张图片都有对应的标签,表示图片中的数字是什么。MNIST数据集是计算机视觉领域的“Hello World”级别的数据集,被广泛用于计算机视觉模型的训练和测试。
|
3月前
|
机器学习/深度学习 数据可视化 数据处理
【学习】深度学习代码各个步骤都是为了啥(三)
【学习】深度学习代码各个步骤都是为了啥(三)
41 0
|
3月前
|
机器学习/深度学习 算法框架/工具 容器
【学习】深度学习代码各个步骤都是为了啥(二)
【学习】深度学习代码各个步骤都是为了啥(二)
46 0
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
【学习】深度学习代码各个步骤都是为了啥(一)
【学习】深度学习代码各个步骤都是为了啥(一)
62 0
|
4月前
|
编解码 并行计算 算法
MMdetection框架速成系列 第01部分:学习路线图与步骤+优先学习的两个目标检测模型代码+loss计算流程+遇到问题如何求助+Anaconda3下的安装教程(mmdet+mmdet3d)
Tip:目前 MMDetection 实现的算法中主要包括 one-stage 和 two-stage 算法,而 two-stage 算法可以简单认为是 one-stage + pool + one-stage 步骤。
210 0
|
7月前
|
机器学习/深度学习 算法 BI
|
7月前
|
机器学习/深度学习 监控 Devops
机器学习测试笔记(29)——找到最佳模型及参数
机器学习测试笔记(29)——找到最佳模型及参数
133 0
|
10月前
|
机器学习/深度学习 自然语言处理
小白总结Transformer模型要点(二)(上)
本文主要总结了Transformer模型的要点,包含模型架构各部分组成和原理、常见问题汇总、模型具体实现和相关拓展学习。
小白总结Transformer模型要点(二)(上)
|
10月前
|
机器学习/深度学习 自然语言处理
小白总结Transformer模型要点(一)(下)
本文主要总结了Transformer模型的要点,包含模型架构各部分组成和原理、常见问题汇总、模型具体实现和相关拓展学习。
小白总结Transformer模型要点(一)(下)
热门文章
最新文章
推荐文章
更多