《meaching learning》机器学习学习记录4.神经网络

简介: 备注:其中Latex公式并没有完整显示,但是总体不影响阅读!

机器学习笔记4 - 神经网络

线性回归和逻辑回归都有一个缺点,当特征太多,计算负荷会很大,

引入神经网络

在神经网络中,参数称为权重(weight)

4-1

其中$x_1,x_2,x_3$是输入单元,$a_1,a_2,a_3$是中间单元,负责处理数据传递到下一层,最后是输出单元,其用来计算$h_\theta(x)$。

在一个三层网络中,第一层成为输入层( Input Layer),最后一层称为输出层( Output Layer),中间一层成为隐藏层 (Hidden Layers)。我们为每一层都增加一个偏置单元(bias unit),得到如下图:

4-2

$a^{(j)}_i$表示第$j$层的第$i$个激活单元。$\theta^{(j)}$代表从第$j$层映射到第$j+1$层时的权重矩阵,比如$\theta^{(1)}$表示从第一层映射到第二层的权重矩阵。该矩阵的大小为:以第$j+1$层的激活单元数量为行数,以第$j$层激活单元数加1为列数的矩阵。例:上图神经网络中$\theta^{(1)}$​尺寸为3*4:

对于上图所示的模型,激活单元和输出分别表达为:

4-3

前向传播算法:从左向右的算法,(每一个a都是由上一层所有的$x$和每一个$x$所对一个的决定的)

把$x,\theta,a$​分别用矩阵表示,我们可以得到$\theta*X=a$:

4-4

我们使用向量化的方法来代替循环编码

如下神经网络,我们来计算第二层的值:

4-5

上述计算完成后添加$a^{(2)}_0=1$​,计算输出值如下:

4-6

令$z^{(3)}=\theta^{(2)}a^{(2)}$,则$h_\theta(x)=a^{(3)}=g(z^{(3)})$.

如上是针对一个训练实例的计算,对整个训练集进行计算需要将训练集的特征矩阵进行转置,使得同一个实例的特征都在同一列,即:

$$ z^{(2)}=\theta^{(1)}*X^T $$

$$ a^{(2)}=g(z^{(2)}) $$

如下图,当把神经网络的左半部分遮住,右半部分其实就是以$a_0,a_1,a_2,a_3$​,按照逻辑回归的方式输出$h_\theta(x)$​​。

4-7

神经网络其实就是逻辑回归,只是我们把逻辑回归的输入变量变成了中间层,即:

4-8

我们可以将$a_0,a_1,a_2,a_3$看成相比于$x_0,x_1,x_2,x_3$更高级的特征值,是$x$的进化,其能更好的预测新数据​

特征的直观理解

在神经网络中,原始特征是输入层。

如下通过单层神经元表示逻辑运算,比如逻辑与(AND),逻辑或(OR).

用如下神经网络来表示AND函数

4-9

其中$\theta_0=-30,\theta_1=20,\theta_2=20$,输出函数$h_\theta(x)$为$h_\theta(x)=g(-30+20x_1+20x_2)$

已知$g(x)$​图像是:

4-10

得到真值表:

4-11

同理对于OR函数

4-12

整体一样,$\theta$​取值不同。

逻辑非(NOT)函数:

4-13

XNOR函数(输入的两个值必须一样,均为1或均为0),即

$XNOR=(x_1ANDx_2)OR((NOTx_1)AND(NOTx_2))$

首先得到$(NOTx_1)AND(NOTx_2)$的神经元:

4-14

将$AND$神经元与$(NOTx_1)AND(NOTx_2)$​的神经元以及$OR$​神经元进行组合,

4-15

实现了XNOR运算功能的神经网络

神经网络的优势在于可以构造出很多复杂的杉树,得到更加厉害的特征值。

多类分类问题

4-16

相关文章
|
3月前
|
机器学习/深度学习 算法 数据挖掘
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
151 0
|
2月前
|
JavaScript Java 大数据
基于python的网络课程在线学习交流系统
本研究聚焦网络课程在线学习交流系统,从社会、技术、教育三方面探讨其发展背景与意义。系统借助Java、Spring Boot、MySQL、Vue等技术实现,融合云计算、大数据与人工智能,推动教育公平与教学模式创新,具有重要理论价值与实践意义。
|
9月前
|
机器学习/深度学习 数据采集 运维
机器学习在网络流量预测中的应用:运维人员的智慧水晶球?
机器学习在网络流量预测中的应用:运维人员的智慧水晶球?
442 19
|
9月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
|
9月前
|
人工智能 网络协议 IDE
使用通义灵码AI高效学习muduo网络库开发指南
Muduo 是一个基于 C++11 的高性能网络库,支持多线程和事件驱动,适用于构建高效的服务器和应用程序。它提供 TCP/IP 协议支持、异步非阻塞 I/O、定时器、异步日志等功能,并具备跨平台特性。通过 Git 克隆 muduo 仓库并切换至 C++17 分支可开始使用。借助 AI 工具如 Deepseak-v3,用户可以更便捷地学习和理解 Muduo 的核心模块及编写测试用例,提升开发效率。
|
10月前
|
机器学习/深度学习 边缘计算 运维
机器学习在网络安全中的防护:智能化的安全屏障
机器学习在网络安全中的防护:智能化的安全屏障
482 15
|
网络协议 安全 NoSQL
网络空间安全之一个WH的超前沿全栈技术深入学习之路(8-2):scapy 定制 ARP 协议 、使用 nmap 进行僵尸扫描-实战演练、就怕你学成黑客啦!
scapy 定制 ARP 协议 、使用 nmap 进行僵尸扫描-实战演练等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
网络空间安全之一个WH的超前沿全栈技术深入学习之路(8-2):scapy 定制 ARP 协议 、使用 nmap 进行僵尸扫描-实战演练、就怕你学成黑客啦!
|
机器学习/深度学习 人工智能 数据挖掘
打破传统:机器学习与神经网络获2024年诺贝尔物理学奖引发的思考
诺贝尔物理学奖首次授予机器学习与神经网络领域,标志该技术在物理学研究中的重要地位。本文探讨了这一决定对物理学研究的深远影响,包括数据分析、理论物理突破及未来科研方向的启示,同时分析了其对学术跨界合作与全球科研产业的影响。
228 4
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
773 1
|
机器学习/深度学习 自然语言处理 算法
深入理解机器学习算法:从线性回归到神经网络
深入理解机器学习算法:从线性回归到神经网络