CV常用数据集集合
深度学习需要数据,许许多多的数据。前文提到过的著名图像分类模型的训练都基于庞大的数据集。排名前三的训练数据集分别是:
ImageNet——150 万图像,1000 个对象分类/类别;图像处理常用的数据集ImageNet。
COCO——250 万图像,91 个对象分类;
PASCAL VOC——50 万图像,20 个对象分类。
1、CAISA-WebFace
http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
2、VGG-Face
http://www.robots.ox.ac.uk/~vgg/data/vgg_face/
3、MS-Celeb-1M
4、MegaFace
http://megaface.cs.washington.edu/
图像分类数据集
1、基础数据集
MNIST数据集
Dataset之MNIST:MNIST(手写数字图片识别+ubyte.gz文件)数据集简介+数据增强(将已有MNIST数据集通过移动像素上下左右的方法来扩大数据集为初始数据集的5倍)
CIFAR数据集
Dataset之CIFAR-10:CIFAR-10数据集简介、下载、使用方法之详细攻略
Fashion-MNIST数据集
Dataset之Fashion-MNIST:Fashion-MNIST数据集简介、下载、使用方法之详细攻略
PASCAL VOC数据集
Dataset之Pascal VOC:Pascal VOC(VOC 2012、VOC 2007) 数据集的简介、下载、使用方法详细攻略
ImageNet数据集
Dataset之ImageNet:ImageNet数据集简介、安装、使用方法之详细攻略
WebVision数据集
Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略