eps:(float),lr变化最小值,如果lr的两次变化差距小于eps

简介: q

torch.optim.lr_scheduler.ExponentialLR
torch.optim.lr_scheduler.ExponentialLR(optimizer, gamma, last_epoch=-1)

每个epoch按指数衰减 lr。

74ad498dc056760839e046a74f403e65.png
ExponentialLR
torch.optim.lr_scheduler.CosineAnnealingLR
torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max, eta_min=0, last_epoch=-1)

按照三角函数规则来更新学习率。

表示最小学习率, 即正弦函数最低点

表示最大学习率, 设置为initial_Ir (在last_epoch=-1 时, 即为Ir)。

表示当前epoch数

表示 个 周期所对应的epoch数值

411d725ccd77483de09be33396c04f44.png
CosineAnnealingLR
torch.optim.lr_scheduler.ReduceLROnPlateau
torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, verbose=False, threshold=0.0001, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-08)

根据指定的指标量来调整学习率。如果指标量停止变化时,就减小学习率。
参数:

mode:(str),从(min, max)中选择。

min:如果指定量不再下降,就减小lr

max:如果指定量不再上升,就减小lr

factor:(float),衰减因子,每次更新lr = lr * factor

patience:(int),容忍度,如果经过patience次迭代后,指标没有变化(上升或下降),就更新lr。

verbose:(bool),每次更新lr,是否向std输出。

threshold:(float),阈值,对于制定的指标只有超过阈值才算有变化

threshold_mode:(str),从(rel,abs)总选择。性能衡量方式。

max模式下:dynamic_threshold = best + threshold

min模式下:dynamic_threshold = best - threshold

max模式下:dynamic_threshold = best * ( 1 + threshold )

min模式下:dynamic_threshold = best * ( 1 - threshold )

rel:

abs:

cooldown:(int),每次调整lr之后,冷却cooldown个epoch,避免lr下降过快

min_lr:(float or list),学习率最小值。如果给定一个标量值,就param_groups中所有组都设置该最小值;也可以用一个list为每组指定一个最小值。

eps:(float),lr变化最小值,如果lr的两次变化差距小于eps,则忽略这次变化。

相关文章
交流电路理论:峰值、平均值和RMS值的计算公式
除了频率和周期之外,AC 波形的一个关键属性是振幅,它表示交变波形的最大值,或者更广为人知的是峰值。
7605 0
交流电路理论:峰值、平均值和RMS值的计算公式
差异基因分析:fold change(差异倍数), P-value(差异的显著性)
差异基因分析:fold change(差异倍数), P-value(差异的显著性)
3080 0
差异基因分析:fold change(差异倍数), P-value(差异的显著性)
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
最大值归一化介绍
【10月更文挑战第2天】
121 0
|
5月前
|
机器学习/深度学习 算法 C++
C++多态崩溃问题之为什么在计算梯度下降时需要除以批次大小(batch size)
C++多态崩溃问题之为什么在计算梯度下降时需要除以批次大小(batch size)
|
5月前
|
Python
Fama-French模型,特别是三因子模型(Fama-French Three-Factor Model)
Fama-French模型,特别是三因子模型(Fama-French Three-Factor Model)
|
6月前
技术心得记录:可决系数R^2和方差膨胀因子VIF
技术心得记录:可决系数R^2和方差膨胀因子VIF
74 0
|
机器学习/深度学习 PyTorch 算法框架/工具
base model初始化large model,造成的参数矩阵对不上权重不匹配问题+修改预训练权重形状和上采样
base model初始化large model,造成的参数矩阵对不上权重不匹配问题+修改预训练权重形状和上采样
226 0
|
存储 C++
精度误差问题与eps
精度误差问题与eps
139 0
|
机器学习/深度学习 数据可视化 Python
batch_size对精确度和损失的影响
batch_size对精确度和损失的影响
316 0
007.AcWing 790. 数的三次方根(002)
二分法 相关文章:《二分法的模板讲解》
58 0