深度神经网络基本问题的原理详细分析和推导

简介: rt,深度神经网络基本问题的原理详细分析和推导
+关注继续查看

目录
神经网络算法的直观了解
21 表征假设和激活函数
1 神经网络过程描述
2 神经网络相关的几个问题
22 结构设计Architecture Design
23 代价函数Cost Function和优化目标Optimization objective
24 如何进行优化
3 参考资料
前馈传播和结构设计
11 本章节说明
12 通用逼近定理的严谨表述
12 从非线性讲起为什么使用激活函数
13 前馈网络拟合函数过程
2 前馈网络进行逼近的拟合过程
121 来自Approximation by Superpositions of a Sigmoidal Function这篇论文的观点
121 来自On the Number of Linear Regions of Deep Neural Networks这篇论文的观点
11 以sigmoid为例
11 ReLU的拟合
1 通用逼近性质理论Universal Approximation PropertiesTheorem神经网络可以逼近任意函数
3 关于通用逼近定理的补充说明
4 参考资料
目标优化
11 从单变量函数开始
12 多元函数的梯度下降
2 学习率learning rate的选择
1 基于梯度的目标优化
3 其他优化算法
4 参考资料
基于梯度的神经网络优化
31 BP算法的定义理解误区
32 预备知识
33 深度神经网络中递归使用链式法则
34 反向传播算法的伪代码
35 补充基于计算图的更通用的反向传播伪代码
361 反向传播过程
321 张量tensor
322 微积分中的链式法则和其在高维度的推广
341 基于全连接的多层感知机的伪代码
351 上一节的代码的改进空间
351 计算图Computational Graphs
352 举例说明
21 广义线性模型generalized linear model GLM
22 广义线性模型
23 伯努利分布Bernoulli Distributions和Sigmoid 函数单元
24 其他输出层的激活函数单元
241 多项分布和广义线性模型
242 其他分布和对应单元
25 本节其他参考资料
211 指数族Exponential family or Exponential class
221 广义线性模型的直观解释从线性模型讲起
222 数学定义
231 伯努利分布和广义线性模型
232 sigmoid为激活函数的交叉熵代价函数的推导后续
233 梯度下降法的进一步推导交叉熵解决函数饱和saturates问题
11 极大似然法和交叉熵Maximum Likelihood Estimation
12 交叉熵cross-entropy error代价函数
122 交叉熵代价函数
123 交叉熵代价函数的好处
13 本节其他参考资料
111概率统计知识总体样本随机变量独立同分布参数估计
112 极大思然估计
121 交叉熵相对熵KL散度的概念
1 目标函数的表达式模型的确定
2 选择概率分布模型和对应的输出单元
3 多层网络的梯度如何获得
4 参考资料
前馈传播过程隐藏层激活函数
31 logistic Sigmoid
32 双曲切线函数tanh
21 ReLu
22 ReLU的扩展
23 ReLU的设计原则
1 激活函数期待具有的性质
11 非线性
12 只有有限个离散点不可微non-differentiability
13 有限范围
14 接近恒等函数
2 线性整流单元Rectified Linear Units和其衍生单元
3 Logistic Sigmoid 和 Hyperbolic Tangent
4 参考资料

__20180730104523
__20180730104535
__20180730104547
__20180730104555


原文发布时间为:2018-07-30
本文作者:大数据挖掘DT机器学习
本文来自云栖社区合作伙伴“大数据挖掘DT机器学习”,了解相关信息可以关注“大数据挖掘DT机器学习”。
相关文章
|
25天前
线性规划模型基本原理与编程实现
线性规划模型基本原理与编程实现
7 0
线性规划模型基本原理与编程实现
|
3月前
双层优化入门(1)—基本原理与求解方法(附matlab代码)
双层优化问题(Bilevel Programming Problems),也被称为双层规划,最早由Stackelberg与1934年在经济学相关研究中提出,因此也被称为Stackelberg问题。双层规划问题一般具有层次性、独立性、冲突性、优先性和自主性等特点。 本文介绍了双层优化的原理与求解方法,并提供了相应的matlab代码供参考学习。
|
4月前
|
分布式计算 监控 算法
Pregel模型原理
Pregel模型原理
66 0
|
5月前
logistic模型原理与推导过程分析(3)
由上面的式子可以看出,g(A)的参数是一个m*1的矩阵,或者说是一个列向量。如果我们设计函数g的时候,支持传入一个列向量,并返回一个列向量,则hθ(x)−y可以一次计算得到结果。
39 0
|
5月前
|
机器学习/深度学习 算法 大数据
logistic模型原理与推导过程分析(2)
其中m表示样本个数,n表示影响因数的个数,yi(i=0,1,⋯ ,m)取0或者1。现在我们结合数据,利用条件概率分布模型给出基于概率的二项logistic模型如下
69 0
|
5月前
|
机器学习/深度学习 算法 数据挖掘
logistic模型原理与推导过程分析(1)
给定一些数据集合,他们分别属于两个不同的类别。例如对于广告数据来说,是典型的二分类问题,一般将被点击的数据称为正样本,没被点击的数据称为负样本。现在我们要找到一个线性分类器,将这些数据分为两类。用X表示样本数据,Y表示样本类别(例如1与-1,或者1与0)。我们线性分类器的目的,就是找到一个超平面将两类样本分开。
84 0
|
8月前
|
机器学习/深度学习 算法 BI
|
10月前
|
机器学习/深度学习 人工智能 算法
一文搞懂模型量化算法基础
一文搞懂模型量化算法基础
1700 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
图机器学习(GML)&图神经网络(GNN)原理和代码实现(前置学习系列二)
现在已经覆盖了图的介绍,图的主要类型,不同的图算法,在Python中使用Networkx来实现它们,以及用于节点标记,链接预测和图嵌入的图学习技术,最后讲了GNN分类应用以及未来发展方向!
|
机器学习/深度学习 算法
变分推断|机器学习推导系列(十四)
变分推断|机器学习推导系列(十四)
110 0
变分推断|机器学习推导系列(十四)
相关产品
机器翻译
推荐文章
更多