【pytorch深度学习实践】笔记—03.2.随机梯度下降

2023-01-07 139 发布于黑龙江

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【pytorch深度学习实践】笔记—03.2.随机梯度下降

1.背景及思路

【思想】

1.使用梯度下降是可以解决大多数问题的，但是遇到“鞍点”问题无法解决。

2.使用梯度下降更新权重w的时候，对于每一个w，计算cost损失、计算梯度的时候，都要对所有样本[x1,y1]、[x2, y2]……[xn,yn]求cost损失和梯度的均值。实际上我们最主要的目标是找到最接近的w的值，只要多训练几次，对于cost和梯度取不取均值，没有太大区别。所以没有必要把计算时间都浪费在cost和梯度的均值上。所以引入随机梯度。

3.即：第一次用[x1,y1]这组数据计算梯度、更新w；第二次用[x2,y2]这组数据计算梯度、更新w……以此类推，每次随机抽取的用来计算梯度的样本[xn,yn]不是固定的，所以叫做随机梯度下降。

2.pytorch全套代码

import matplotlib.pyplot as plt
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
# 初始化权重
w = 1.0
# 定义模型
def forward(x):
    return x * w
def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y) ** 2
# 定义梯度计算方法（使用随机梯度下降）
def gradient(xs, ys):
    return 2 * x * (x * w - y)
# 最终绘制图像的x
epoch_list = []
cost_list = []
print ('Predict (before training)', 4 , forward(4))
for epoch in range(100):
    for x, y in zip(x_data, y_data):
        grad = gradient(x, y)
        w = w - 0.01 * grad
        print("\t x=", x, "y=", y, "grade:", grad)
        l = loss(x, y)
    print(' Epoch:', epoch, ' w=', w, ' loss=', l)
    epoch_list.append(epoch)
    cost_list.append(l)
print('Predict (after training)', 4, forward(4))
# 绘图
plt.plot(epoch_list, cost_list)
plt.ylabel('cost')
plt.xlabel('epoch')
plt.show()

3.展示pytorch绘制的图像（epoch-loss）

从图中可以发现，当训练epoch次数增加的时候，损失值会越来越小。

此时打印4 和forward(4)，就会得到forward(4)的值接近于8。所以权重w=y/x=2

b0f454fbc374c6b99f8c423112faf830_watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzM4MDY4ODc2,size_16,color_FFFFFF,t_70#pic_center.png

【pytorch深度学习实践】笔记—03.2.随机梯度下降

1.背景及思路

2.pytorch全套代码

3.展示pytorch绘制的图像（epoch-loss）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【pytorch深度学习实践】笔记—03.2.随机梯度下降

1.背景及思路

2.pytorch全套代码

3.展示pytorch绘制的图像（epoch-loss）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像