2.2、C3D视频动作识别
2.2.1、UCF101数据集
数据集由101个人类动作类别的13,320个视频组成。我们使用此数据集提供的三个拆分设置。
train_dataloader = DataLoader(VideoDataset(dataset=dataset, split='train', clip_len=16), batch_size=4, shuffle=True, num_workers=0) val_dataloader = DataLoader(VideoDataset(dataset=dataset, split='val', clip_len=16), batch_size=4, num_workers=0) test_dataloader = DataLoader(VideoDataset(dataset=dataset, split='test', clip_len=16), batch_size=4, num_workers=0) trainval_loaders = {'train': train_dataloader, 'val': val_dataloader} trainval_sizes = {x: len(trainval_loaders[x].dataset) for x in ['train', 'val']} test_size = len(test_dataloader.dataset)
2.2.2、分类模型
提取C3D特征并将其输入到用于训练模型
2.3、测试结果
参考: