「卷积神经网络」实战 Kaggle 竞赛：树叶分类-阿里云开发者社区

「卷积神经网络」实战 Kaggle 竞赛：树叶分类

2022-09-27 343

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 「卷积神经网络」实战 Kaggle 竞赛：树叶分类

导入必要的库。
%matplotlib inline
import random
import torch
from torch import nn
from torch.nn import functional as F
from torchvision import datasets, transforms
import pandas as pd
import matplotlib.pyplot as plt
from d2l import torch as d2l
from PIL import Image
读取训练数据与测试数据，并转化为 NumPy 格式，方便后续实现自定义 Dataset。
train_data = pd.read_csv('./data/train.csv')
test_data = pd.read_csv('./data/test.csv')

train_images = train_data.iloc[:, 0].values
pred_images = test_data.iloc[:, 0].values
train_labels = pd.get_dummies(train_data.iloc[:, 1]).values.argmax(1)
train_labels_header = pd.get_dummies(train_data.iloc[:, 1]).columns.values

n_train = train_images.shape[0]
继承 torch.utils.Dataset 类，自定义树叶分类数据集。
class CLASSIFY_LEAVES(torch.utils.data.Dataset):

def __init__(self, root, images, labels, transform):
    super(CLASSIFY_LEAVES, self).__init__()
    self.root = root
    self.images = images
    if labels is None:
        self.labels = None
    else:
        self.labels = labels
    self.transform = transform
def __getitem__(self, index):
    image_path = self.root + self.images[index]
    image = Image.open(image_path)
    image = self.transform(image)
    if self.labels is None:
        return image
    label = torch.tensor(self.labels[index])
    return image, label
def __len__(self):
    return self.images.shape[0]

def load_data(images, labels, batch_size, train):

aug = []
if (train):
    aug = [transforms.RandomHorizontalFlip(),
           transforms.RandomVerticalFlip(),
           transforms.ColorJitter(brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5),
           transforms.ToTensor()]
else:
    aug = [transforms.ToTensor()]
transform = transforms.Compose(aug)
dataset = CLASSIFY_LEAVES('./data/', images, labels, transform=transform)
return torch.utils.data.DataLoader(dataset=dataset, batch_size=batch_size, num_workers=8, shuffle=train)

使用 ResNet-18 网络，并初始化。
net = get_resnet18()

def init_weights(m):

if type(m) == nn.Linear or type(m) == nn.Conv2d:
    nn.init.xavier_uniform_(m.weight)

net.apply(init_weights)
定义训练函数，使用多 GPU 训练。
def accuracy(y_hat, y):

return (y_hat.argmax(1) == y).sum()

def train(net, train_iter, test_iter, num_epochs, lr, devices):

net = nn.DataParallel(net, device_ids = devices).to(devices[0])
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
loss = nn.CrossEntropyLoss()
animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs], legend=['train acc', 'test acc'])
for epoch in range(num_epochs):
    train_loss_tot, train_acc_tot, train_tot = 0, 0, 0
    test_acc_tot, test_tot = 0, 0
    net.train()
    for X, y in train_iter:
        optimizer.zero_grad()
        X, y = X.to(devices[0]), y.to(devices[0])
        y_hat = net(X)
        l = loss(y_hat, y)
        l.backward()
        optimizer.step()
        with torch.no_grad():
            train_loss_tot += l * X.shape[0]
            train_acc_tot += accuracy(y_hat, y)
            train_tot += X.shape[0]
    net.eval()
    with torch.no_grad():
        for X, y in test_iter:
            X, y = X.to(devices[0]), y.to(devices[0])
            test_acc_tot += accuracy(net(X), y)
            test_tot += X.shape[0]
    train_loss = train_loss_tot / train_tot
    train_acc = train_acc_tot / train_tot
    test_acc = test_acc_tot / test_tot
    animator.add(epoch + 1, (train_acc.cpu(), test_acc.cpu()))
    torch.save(net.state_dict(), 'resnet18.params')

随机抽取 15000 个训练数据，以及 3000 个测试数据，并初始化迭代器。
train_slices = random.sample(list(range(n_train)), 15000)
test_slices = list(set(range(n_train)) - set(train_slices))

train_iter = load_data(train_images[train_slices], train_labels[train_slices], 512, train=True)
test_iter = load_data(train_images[test_slices], train_labels[test_slices], 512, train=False)
训练。
train(net, train_iter, test_iter, 10, 0.01, [torch.device('cuda:0'),

                                         torch.device('cuda:1')])

预测，并写入 submission.csv。注意推理仍需要在 GPU 上运行。
pred_iter = load_data(pred_images, None, 256, train=False)

def predict(net, pred_iter):

net.to(torch.device('cuda:0'))
net.eval()
prediction = []
for index, X in enumerate(pred_iter):
    X = X.to('cuda:0')
    prediction.extend(train_labels_header[net(X).argmax(1).cpu()])
test_data['label'] = prediction
test_data.to_csv('./data/submission.csv', index=None)

predict(net, pred_iter)

「卷积神经网络」实战 Kaggle 竞赛：树叶分类

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

「卷积神经网络」实战 Kaggle 竞赛：树叶分类

热门文章

最新文章

相关课程

相关电子书

相关实验场景