使用PyTorch 实现线性回归(4步):
1、构建数据集
2、设计模型(使用类)
3、构造损失函数(loss)和优化器(optimizer)
4、训练周期(前馈、反馈、更新)
1、准备数据
#1.准备数据,注意都是矩阵形式 x_data = torch.Tensor([[1.0], [2.0], [3.0]]) y_data = torch.Tensor([[2.0], [4.0], [6.0]])
2、设计模型
(使用torcn.nn下的Linear模型)
2.设计模型(类) 继承nn.Module 以便使用其方法 class LinearModel(torch.nn.Module): #初始化 def __init__(self): super(LinearModel,self).__init__() self.linear = torch.nn.Linear(1,1) #Linear是一个线性单元 #前馈方法 def forward(self, x): y_pred = self.linear(x) #实际上调用对象linear的__call__()方法,linear的__call__()方法执行forward前馈 return y_pred model = LinearModel()
3、损失和优化器
#3 loss 和 optimizer(优化器) criterion = torch.nn.MSELoss(size_average=False) #不需要求均值 # 优化器。 model.parameters()获取模型中需要优化的参数,lr(learning rate,学习率) optimizer = torch.optim.SGD(model.parameters(),lr=0.01)
4、训练
#4 训练过程 for epoch in range(100): #前馈 y_pred = model(x_data) #计算损失 loss = criterion(y_pred,y_data) print("epoch={},loss={}".format(epoch,loss)) optimizer.zero_grad()#归零 #反向传播 loss.backward() #更新、优化参数 optimizer.step()
完整代码:
import torch #1.准备数据,注意都是矩阵形式 x_data = torch.Tensor([[1.0], [2.0], [3.0]]) y_data = torch.Tensor([[2.0], [4.0], [6.0]]) #2.设计模型(类) 继承nn.Module 以便使用其方法 class LinearModel(torch.nn.Module): #初始化 def __init__(self): super(LinearModel,self).__init__() self.linear = torch.nn.Linear(1,1) #Linear是一个线性单元 #前馈方法 def forward(self, x): y_pred = self.linear(x) #实际上调用对象linear的__call__()方法,linear的__call__()方法执行forward前馈 return y_pred model = LinearModel() #3 loss 和 optimizer(优化器) criterion = torch.nn.MSELoss(size_average=False) #不需要求均值 # 优化器。 model.parameters()获取模型中需要优化的参数,lr(learning rate,学习率) optimizer = torch.optim.SGD(model.parameters(),lr=0.01) #4 训练过程 for epoch in range(100): #前馈 y_pred = model(x_data) #计算损失 loss = criterion(y_pred,y_data) print("epoch={},loss={}".format(epoch,loss)) optimizer.zero_grad()#归零 #反向传播 loss.backward() #更新、优化参数 optimizer.step() #Test, 查看模型参数及测试训练效果 print('w={}'.format(model.linear.weight.item())) print('b={}'.format(model.linear.bias.item())) x_test = torch.Tensor([[4.0]]) y_test = model(x_test) print('y_pred = {} for x = {}'.format(y_test.data,x_test.data))