深度学习常用数据集介绍与下载（附网盘链接）

2023-04-18 2058

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 深度学习常用数据集介绍与下载（附网盘链接）

1. 分类数据集

数据集：MNIST

手写数字数据集，包含一组60,000个示例的训练集和一组10,000个示例的测试集。

官网地址：MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

关键字（建议复制）：Face-Place

数据集：CIFAR-10

包含了10个类别的60,000个图像（每个类在上图中表示为一行）。总共有50,000个训练图像和10,000个测试图像。

官网地址：CIFAR-10 and CIFAR-100 datasets

关键字（建议复制）：CIFAR-10

数据集：Fashion-MNIST

包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。

官网地址：GitHub - zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark

关键字（建议复制）：fashion-mnist

数据集：Imagenet

Imagenet数据集有1400多万幅图片，涵盖2万多个类别，关于图像分类、定位、检测等研究工作大多基于此数据集展开。

官网地址：http://www.image-net.org/about-stats

关键字（建议复制）：ImageNet

2. 目标检测数据集

数据集：MS-COCO

COCO是一个规模大且丰富的物体检测，分割和字幕数据集。330K图像，80个物体类别，每幅图像5个字幕，250，000个有关键点的人。

官网地址：COCO - Common Objects in Context

关键字（建议复制）：MS-COCO

数据集：PASCAL-VOC

PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试，提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统，包括20个目录。

官网地址：The PASCAL Visual Object Classes Homepage

关键字（建议复制）：PASCAL-VOC

数据集：BDD100K

自动驾驶常用大型多样化数据集，标注超过100,000张图像，类别包含公共汽车，行人，自行车，卡车，小汽车，火车和骑手等，用于目标检测、全帧分割等。

官网地址：Berkeley DeepDrive

关键字（建议复制）：BDD-100K

数据集：Open-Images

Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。

官网地址：Open Images V6

关键字（建议复制）：Open-Images

3. 人脸识别数据集

数据集：CASIA-WebFace

包含了10575 个人的494414 张图像。CASIA-webface数据库，里面包含了10000个人，一共50万张人脸图片，均来源于网络。

官网地址：NameBright - Coming Soon

关键字（建议复制）：CASIA-WebFace

数据集：PubFig

哥伦比亚大学的公众人物脸部数据集，包含有200个人的58k+人脸图像，主要用于非限制场景下的人脸识别。

官网地址：Pubfig: Public Figures Face Database

关键字（建议复制）：PubFig

数据集：CelebA

香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片，人脸属性有40多种，主要用于人脸属性的识别。

官网地址：CelebA Dataset

关键字（建议复制）：CelebA

数据集：ColorFeret

包括了一个通用人脸库以及通用测试标准，它已经包含了1000多人的10000多张照片，每个人包括了不同表情，光照，姿态和年龄的照片。

官网地址：color FERET Database | NIST

关键字（建议复制）：ColorFeret

数据集：MTFL

该数据集包含了将近13000张人脸图片，均采自网络。

官网地址：Facial Landmark Detection by Deep Multi-task Learning

关键字（建议复制）：MTFL

数据集：FaceDB

包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。

官网地址：BioID Face Database | Face Detection Dataset | facedb - BioID

关键字（建议复制）：FaceDB

数据集：LFW

为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。

官网地址：http://vis-www.cs.umass.edu/lfw/

关键字（建议复制）：LFW

数据集：Person identification in TV series

该数据集所选用的人脸照片均来自于两部比较知名的电视剧，《吸血鬼猎人巴菲》和《生活大爆炸》。

官网地址：Semi-supervised Learning with Constraints for Person Identification in Multimedia Data

关键字（建议复制）：PITVS

数据集：CMUVASC-PIE

CMU PIE人脸库建立于2000年11月，它包括来自68个人的40000张照片，其中包括了每个人的13种姿态条件，43种光照条件和4种表情下的照片。

官网地址：http://vasc.ri.cmu.edu/idb/html/face/index.html

关键字（建议复制）：CMUVASC-PIE

数据集：CASIA-FaceV5

该数据集包含了来自500个人的2500张亚洲人脸图片。

官网地址：http://biometrics.idealtest.org/dbDetailForUser.do?id=9

关键字（建议复制）：CASIA-FaceV5

数据集：The CNBC Face Database

该数据集采集了200个人在不同状态下（不同的神情，装扮，发型等）的人脸照片。

官网地址：http://wiki.cnbc.cmu.edu/Face_Place

关键字（建议复制）：Face-Place

数据集：IMDB-WIKI

IMDB-WIKI人脸数据库总共523,051张人脸数据库，每张图片都被标注了人的年龄和性别，对于年龄识别和性别识别的研究有着重要的意义。

官网地址：IMDB-WIKI - 500k+ face images with age and gender labels

关键字（建议复制）：IMDB-WIKI

数据集：FDDB

FDDB是UMass的数据集，被用来做人脸检测(Face Detection)。这个数据集比较大，比较有挑战性。

官网地址：http://vis-www.cs.umass.edu/fddb/index.html

关键字（建议复制）：FDDB

数据集：Caltech-10K-WebFaces

10k+人脸，提供双眼和嘴巴的坐标位置。

官网地址：ttp://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description

关键字（建议复制）：Caltech-10K

数据集：JAFFE

该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像，10个人，全部都是女性，每个人做出7种表情。

官网地址：The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo

关键字（建议复制）：JAFFE

数据集：AFLW

前2000个AFLW样本的拟合3D面，可用于3D面对齐评估。

官网地址：http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm

关键字（建议复制）：AFLW

深度学习常用数据集介绍与下载（附网盘链接）

1. 分类数据集

数据集：MNIST

数据集：CIFAR-10

数据集：Fashion-MNIST

数据集：Imagenet

2. 目标检测数据集

数据集：MS-COCO

数据集：PASCAL-VOC

数据集：BDD100K

数据集：Open-Images

3. 人脸识别数据集

数据集：CASIA-WebFace

数据集：PubFig

数据集：CelebA

数据集：ColorFeret

数据集：MTFL

数据集：FaceDB

数据集：LFW

数据集：Person identification in TV series

数据集：CMUVASC-PIE

数据集：CASIA-FaceV5

数据集：The CNBC Face Database

数据集：IMDB-WIKI

数据集：FDDB

数据集：Caltech-10K-WebFaces

数据集：JAFFE

数据集：AFLW

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

深度学习常用数据集介绍与下载（附网盘链接）

1. 分类数据集

数据集：MNIST

数据集：CIFAR-10

数据集：Fashion-MNIST

数据集：Imagenet

2. 目标检测数据集

数据集：MS-COCO

数据集：PASCAL-VOC

数据集：BDD100K

数据集：Open-Images

3. 人脸识别数据集

数据集：CASIA-WebFace

数据集：PubFig

数据集：CelebA

数据集：ColorFeret

数据集：MTFL

数据集：FaceDB

数据集：LFW

数据集：Person identification in TV series

数据集：CMUVASC-PIE

数据集：CASIA-FaceV5

数据集：The CNBC Face Database

数据集：IMDB-WIKI

数据集：FDDB

数据集：Caltech-10K-WebFaces

数据集：JAFFE

数据集：AFLW

热门文章

最新文章

相关课程

相关电子书

相关实验场景