深度学习常用数据集介绍与下载(附网盘链接)

简介: 深度学习常用数据集介绍与下载(附网盘链接)

1. 分类数据集


数据集:MNIST



       手写数字数据集,包含一组60,000个示例的训练集和一组10,000个示例的测试集。

       官网地址:MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

       关键字(建议复制):Face-Place


数据集:CIFAR-10



       包含了10个类别的60,000个图像(每个类在上图中表示为一行)。总共有50,000个训练图像和10,000个测试图像。

       官网地址:CIFAR-10 and CIFAR-100 datasets

       关键字(建议复制):CIFAR-10


数据集:Fashion-MNIST



       包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。

       官网地址:GitHub - zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark

       关键字(建议复制):fashion-mnist


数据集:Imagenet



       Imagenet数据集有1400多万幅图片,涵盖2万多个类别,关于图像分类、定位、检测等研究工作大多基于此数据集展开。

       官网地址:http://www.image-net.org/about-stats

       关键字(建议复制):ImageNet


2. 目标检测数据集


数据集:MS-COCO



       COCO是一个规模大且丰富的物体检测,分割和字幕数据集。330K图像,80个物体类别,每幅图像5个字幕,250,000个有关键点的人。

       官网地址:COCO - Common Objects in Context

       关键字(建议复制):MS-COCO


数据集:PASCAL-VOC



       PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统,包括20个目录。

       官网地址:The PASCAL Visual Object Classes Homepage

       关键字(建议复制):PASCAL-VOC


数据集:BDD100K



       自动驾驶常用大型多样化数据集,标注超过100,000张图像,类别包含公共汽车,行人,自行车,卡车,小汽车,火车和骑手等,用于目标检测、全帧分割等。

       官网地址:Berkeley DeepDrive

       关键字(建议复制):BDD-100K


数据集:Open-Images



       Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。

       官网地址:Open Images V6

       关键字(建议复制):Open-Images


3. 人脸识别数据集


数据集:CASIA-WebFace



       包含了10575 个人的494414 张图像。CASIA-webface数据库,里面包含了10000个人,一共50万张人脸图片,均来源于网络。

       官网地址:NameBright - Coming Soon

       关键字(建议复制):CASIA-WebFace


数据集:PubFig



       哥伦比亚大学的公众人物脸部数据集,包含有200个人的58k+人脸图像,主要用于非限制场景下的人脸识别。

       官网地址:Pubfig: Public Figures Face Database

       关键字(建议复制):PubFig


数据集:CelebA



       香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片,人脸属性有40多种,主要用于人脸属性的识别。

       官网地址:CelebA Dataset

       关键字(建议复制):CelebA


数据集:ColorFeret



       包括了一个通用人脸库以及通用测试标准,它已经包含了1000多人的10000多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。

       官网地址:color FERET Database | NIST

       关键字(建议复制):ColorFeret


数据集:MTFL



       该数据集包含了将近13000张人脸图片,均采自网络。

       官网地址:Facial Landmark Detection by Deep Multi-task Learning

       关键字(建议复制):MTFL


数据集:FaceDB



       包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。

       官网地址:BioID Face Database | Face Detection Dataset | facedb - BioID

       关键字(建议复制):FaceDB


数据集:LFW



       为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。

       官网地址:http://vis-www.cs.umass.edu/lfw/

       关键字(建议复制):LFW


数据集:Person identification in TV series



       该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。

       官网地址:Semi-supervised Learning with Constraints for Person Identification in Multimedia Data

       关键字(建议复制):PITVS


数据集:CMUVASC-PIE



       CMU PIE人脸库建立于2000年11月,它包括来自68个人的40000张照片,其中包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片。

       官网地址:http://vasc.ri.cmu.edu/idb/html/face/index.html

       关键字(建议复制):CMUVASC-PIE


数据集:CASIA-FaceV5



       该数据集包含了来自500个人的2500张亚洲人脸图片。

       官网地址:http://biometrics.idealtest.org/dbDetailForUser.do?id=9

       关键字(建议复制):CASIA-FaceV5


数据集:The CNBC Face Database



       该数据集采集了200个人在不同状态下(不同的神情,装扮,发型等)的人脸照片。

       官网地址:http://wiki.cnbc.cmu.edu/Face_Place

       关键字(建议复制):Face-Place


数据集:IMDB-WIKI



       IMDB-WIKI人脸数据库总共523,051张人脸数据库,每张图片都被标注了人的年龄和性别,对于年龄识别和性别识别的研究有着重要的意义。

       官网地址:IMDB-WIKI - 500k+ face images with age and gender labels

       关键字(建议复制):IMDB-WIKI


数据集:FDDB



       FDDB是UMass的数据集,被用来做人脸检测(Face Detection)。这个数据集比较大,比较有挑战性。

       官网地址:http://vis-www.cs.umass.edu/fddb/index.html

       关键字(建议复制):FDDB


数据集:Caltech-10K-WebFaces



       10k+人脸,提供双眼和嘴巴的坐标位置。

       官网地址:ttp://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description

       关键字(建议复制):Caltech-10K


数据集:JAFFE



       该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像,10个人,全部都是女性,每个人做出7种表情。

       官网地址:The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo

       关键字(建议复制):JAFFE


数据集:AFLW



       前2000个AFLW样本的拟合3D面,可用于3D面对齐评估。

       官网地址:http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm

       关键字(建议复制):AFLW

相关文章
|
1天前
|
机器学习/深度学习 算法 网络架构
基于yolov2深度学习网络的人脸检测matlab仿真,图像来自UMass数据集
**YOLOv2算法在MATLAB2022a中实现人脸检测:** 展示6个检测结果图,利用Darknet-19进行特征提取,网络每个网格预测BBox,包含中心偏移、尺寸、置信度和类别概率。多任务损失函数结合定位、置信度和分类误差。程序加载预训练模型,遍历图像,对检测到的人脸以0.15阈值画出边界框并显示。
|
1天前
|
机器学习/深度学习 人工智能 PyTorch
【深度学习】MNIST手写数字数据集的分类识别
【深度学习】MNIST手写数字数据集的分类识别
|
1天前
|
机器学习/深度学习 编解码 运维
深度学习数据集合(交通标志/火焰/手写字符/道路裂缝数据集)
深度学习数据集合(交通标志/火焰/手写字符/道路裂缝数据集)
51 0
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
20用于深度学习训练和研究的数据集
无论是图像识别,自然语言处理,医疗保健还是任何其他人工智能领域感兴趣,这些数据集都是非常重要的,所以本文将整理常用且有效的20个数据集。
128 1
|
1天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【Python深度学习】Tensorflow+CNN进行人脸识别实战(附源码和数据集)
【Python深度学习】Tensorflow+CNN进行人脸识别实战(附源码和数据集)
184 0
|
1天前
|
机器学习/深度学习 数据采集 TensorFlow
【Tensorflow深度学习】实现手写字体识别、预测实战(附源码和数据集 超详细)
【Tensorflow深度学习】实现手写字体识别、预测实战(附源码和数据集 超详细)
100 1
|
7月前
|
机器学习/深度学习 数据可视化 算法
【深度学习】实验02 鸢尾花数据集分析
【深度学习】实验02 鸢尾花数据集分析
122 0
|
9月前
|
机器学习/深度学习 存储 PyTorch
深度学习实践篇 第一章:数据集读取和构建
简要介绍cifar数据集的使用和pytorch数据集的构建。
409 0
|
10月前
|
机器学习/深度学习 数据采集 TensorFlow
深度学习模型在图像识别中的应用:CIFAR-10数据集实践与准确率分析
深度学习模型在图像识别中的应用:CIFAR-10数据集实践与准确率分析
442 0
|
11月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【深度学习】基于tensorflow的服装图像分类训练(数据集:Fashion-MNIST)
【深度学习】基于tensorflow的服装图像分类训练(数据集:Fashion-MNIST)
200 0