华为ICT——第一章-神经网络基础 私人笔记

简介: 机器学习方法分类 1:监督 2:无监督 3:自监督

1.1机器学习方法分类 1:监督 2:无监督 3:自监督  

机器学习整体步骤:

2.

生物神经网络:


3.宽度=个数



4.


人工神经网络:

5.

输入层——隐藏层——输出层


6.深度学习发展史:

7.

大模型核心:Transformer


损失函数:



经验值:


真实值与预测值的差距:小-准确。相反。最小值(最小化)


梯度下降:增长的最快


反向传播:


更新参数:



均方差损失函数:(主要用于回归问题)



交叉熵损失函数:(主要用于分类问题)



梯度下降法:



小批量梯度下降Mbgd(一般都用):




 


优化器:

 SGD:随机优化器随机梯度下降(SGD)与其他优化器的比较 - 知乎


动量优化器(惯性):


 


一直到全局最优值


Aagrad优化器:



为不同的参数设置不同的学习率,而且学习率会随着模型训练不断变化----Adagrad


Adam:为每个待训练的参数,同时考虑了珂调节的动量项以及可调节的学习率


神经网络的架构设计

度:隐藏层



RMSE(均方根误差)指标越小越好



 


1:训练时间过长(误差变高了。)


2:梯度消失


第一章笔记就结束啦,不懂的欢迎私聊up主


目录
相关文章
|
Linux 开发工具 Android开发
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
ijkplayer是由Bilibili基于FFmpeg3.4研发并开源的播放器,适用于Android和iOS,支持本地视频及网络流媒体播放。本文详细介绍如何在新版Android Studio中导入并使用ijkplayer库,包括Gradle版本及配置更新、导入编译好的so文件以及添加直播链接播放代码等步骤,帮助开发者顺利进行App调试与开发。更多FFmpeg开发知识可参考《FFmpeg开发实战:从零基础到短视频上线》。
1756 2
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
|
机器学习/深度学习 数据可视化 计算机视觉
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
这篇文章详细介绍了如何通过可视化深度学习中每层特征层来理解网络的内部运作,并使用ResNet系列网络作为例子,展示了如何在训练过程中加入代码来绘制和保存特征图。
536 1
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
|
机器学习/深度学习 数据可视化 Windows
深度学习笔记(七):如何用Mxnet来将神经网络可视化
这篇文章介绍了如何使用Mxnet框架来实现神经网络的可视化,包括环境依赖的安装、具体的代码实现以及运行结果的展示。
281 0
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 GhostNet V3 2024华为的重参数轻量化模型
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 GhostNet V3 2024华为的重参数轻量化模型
793 18
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 GhostNet V3 2024华为的重参数轻量化模型
|
机器学习/深度学习 人工智能 自然语言处理
YOLOv11改进策略【模型轻量化】| 替换华为的极简主义骨干网络:VanillaNet
YOLOv11改进策略【模型轻量化】| 替换华为的极简主义骨干网络:VanillaNet
676 16
YOLOv11改进策略【模型轻量化】| 替换华为的极简主义骨干网络:VanillaNet
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 GhostNet V3 2024华为的重参数轻量化模型
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 GhostNet V3 2024华为的重参数轻量化模型
541 2
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 GhostNet V3 2024华为的重参数轻量化模型
|
机器学习/深度学习 人工智能 自然语言处理
RT-DETR改进策略【模型轻量化】| 替换华为的极简主义骨干网络:VanillaNet
RT-DETR改进策略【模型轻量化】| 替换华为的极简主义骨干网络:VanillaNet
443 0
|
机器学习/深度学习 编解码 算法
轻量级网络论文精度笔记(三):《Searching for MobileNetV3》
MobileNetV3是谷歌为移动设备优化的神经网络模型,通过神经架构搜索和新设计计算块提升效率和精度。它引入了h-swish激活函数和高效的分割解码器LR-ASPP,实现了移动端分类、检测和分割的最新SOTA成果。大模型在ImageNet分类上比MobileNetV2更准确,延迟降低20%;小模型准确度提升,延迟相当。
805 1
轻量级网络论文精度笔记(三):《Searching for MobileNetV3》
|
机器学习/深度学习 网络架构 计算机视觉
目标检测笔记(一):不同模型的网络架构介绍和代码
这篇文章介绍了ShuffleNetV2网络架构及其代码实现,包括模型结构、代码细节和不同版本的模型。ShuffleNetV2是一个高效的卷积神经网络,适用于深度学习中的目标检测任务。
384 1
目标检测笔记(一):不同模型的网络架构介绍和代码
|
网络虚拟化 数据安全/隐私保护 数据中心
对比了思科和华为网络设备的基本配置、接口配置、VLAN配置、路由配置、访问控制列表配置及其他重要命令
本文对比了思科和华为网络设备的基本配置、接口配置、VLAN配置、路由配置、访问控制列表配置及其他重要命令,帮助网络工程师更好地理解和使用这两个品牌的产品。通过详细对比,展示了两者的相似之处和差异,强调了持续学习的重要性。
795 2

热门文章

最新文章