深度学习常用数据集介绍与下载(附网盘链接)

简介: 深度学习常用数据集介绍与下载(附网盘链接)

1. 分类数据集


数据集:MNIST



       手写数字数据集,包含一组60,000个示例的训练集和一组10,000个示例的测试集。

       官网地址:MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

       关键字(建议复制):Face-Place


数据集:CIFAR-10



       包含了10个类别的60,000个图像(每个类在上图中表示为一行)。总共有50,000个训练图像和10,000个测试图像。

       官网地址:CIFAR-10 and CIFAR-100 datasets

       关键字(建议复制):CIFAR-10


数据集:Fashion-MNIST



       包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。

       官网地址:GitHub - zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark

       关键字(建议复制):fashion-mnist


数据集:Imagenet



       Imagenet数据集有1400多万幅图片,涵盖2万多个类别,关于图像分类、定位、检测等研究工作大多基于此数据集展开。

       官网地址:http://www.image-net.org/about-stats

       关键字(建议复制):ImageNet


2. 目标检测数据集


数据集:MS-COCO



       COCO是一个规模大且丰富的物体检测,分割和字幕数据集。330K图像,80个物体类别,每幅图像5个字幕,250,000个有关键点的人。

       官网地址:COCO - Common Objects in Context

       关键字(建议复制):MS-COCO


数据集:PASCAL-VOC



       PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统,包括20个目录。

       官网地址:The PASCAL Visual Object Classes Homepage

       关键字(建议复制):PASCAL-VOC


数据集:BDD100K



       自动驾驶常用大型多样化数据集,标注超过100,000张图像,类别包含公共汽车,行人,自行车,卡车,小汽车,火车和骑手等,用于目标检测、全帧分割等。

       官网地址:Berkeley DeepDrive

       关键字(建议复制):BDD-100K


数据集:Open-Images



       Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。

       官网地址:Open Images V6

       关键字(建议复制):Open-Images


3. 人脸识别数据集


数据集:CASIA-WebFace



       包含了10575 个人的494414 张图像。CASIA-webface数据库,里面包含了10000个人,一共50万张人脸图片,均来源于网络。

       官网地址:NameBright - Coming Soon

       关键字(建议复制):CASIA-WebFace


数据集:PubFig



       哥伦比亚大学的公众人物脸部数据集,包含有200个人的58k+人脸图像,主要用于非限制场景下的人脸识别。

       官网地址:Pubfig: Public Figures Face Database

       关键字(建议复制):PubFig


数据集:CelebA



       香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片,人脸属性有40多种,主要用于人脸属性的识别。

       官网地址:CelebA Dataset

       关键字(建议复制):CelebA


数据集:ColorFeret



       包括了一个通用人脸库以及通用测试标准,它已经包含了1000多人的10000多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。

       官网地址:color FERET Database | NIST

       关键字(建议复制):ColorFeret


数据集:MTFL



       该数据集包含了将近13000张人脸图片,均采自网络。

       官网地址:Facial Landmark Detection by Deep Multi-task Learning

       关键字(建议复制):MTFL


数据集:FaceDB



       包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。

       官网地址:BioID Face Database | Face Detection Dataset | facedb - BioID

       关键字(建议复制):FaceDB


数据集:LFW



       为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。

       官网地址:http://vis-www.cs.umass.edu/lfw/

       关键字(建议复制):LFW


数据集:Person identification in TV series



       该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。

       官网地址:Semi-supervised Learning with Constraints for Person Identification in Multimedia Data

       关键字(建议复制):PITVS


数据集:CMUVASC-PIE



       CMU PIE人脸库建立于2000年11月,它包括来自68个人的40000张照片,其中包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片。

       官网地址:http://vasc.ri.cmu.edu/idb/html/face/index.html

       关键字(建议复制):CMUVASC-PIE


数据集:CASIA-FaceV5



       该数据集包含了来自500个人的2500张亚洲人脸图片。

       官网地址:http://biometrics.idealtest.org/dbDetailForUser.do?id=9

       关键字(建议复制):CASIA-FaceV5


数据集:The CNBC Face Database



       该数据集采集了200个人在不同状态下(不同的神情,装扮,发型等)的人脸照片。

       官网地址:http://wiki.cnbc.cmu.edu/Face_Place

       关键字(建议复制):Face-Place


数据集:IMDB-WIKI



       IMDB-WIKI人脸数据库总共523,051张人脸数据库,每张图片都被标注了人的年龄和性别,对于年龄识别和性别识别的研究有着重要的意义。

       官网地址:IMDB-WIKI - 500k+ face images with age and gender labels

       关键字(建议复制):IMDB-WIKI


数据集:FDDB



       FDDB是UMass的数据集,被用来做人脸检测(Face Detection)。这个数据集比较大,比较有挑战性。

       官网地址:http://vis-www.cs.umass.edu/fddb/index.html

       关键字(建议复制):FDDB


数据集:Caltech-10K-WebFaces



       10k+人脸,提供双眼和嘴巴的坐标位置。

       官网地址:ttp://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description

       关键字(建议复制):Caltech-10K


数据集:JAFFE



       该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像,10个人,全部都是女性,每个人做出7种表情。

       官网地址:The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo

       关键字(建议复制):JAFFE


数据集:AFLW



       前2000个AFLW样本的拟合3D面,可用于3D面对齐评估。

       官网地址:http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm

       关键字(建议复制):AFLW

相关文章
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
深度学习实践:构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行分类
本文详细介绍如何使用PyTorch构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行图像分类。从数据预处理、模型定义到训练过程及结果可视化,文章全面展示了深度学习项目的全流程。通过实际操作,读者可以深入了解CNN在图像分类任务中的应用,并掌握PyTorch的基本使用方法。希望本文为您的深度学习项目提供有价值的参考与启示。
|
5月前
|
机器学习/深度学习 JavaScript 前端开发
深度学习必备:对数据集的拆分、根据拆分图片拆分labels、对全部标注标签进行区间检查
使用JavaScript代码或浏览器扩展可以一次性在浏览器中打开多个相同的标签页。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
豆瓣评分9.5!清华大牛熬夜整理的Python深度学习教程开发下载!
深度学习目前已经成为了人工智能领域的突出话题。它在“计算机视觉和游戏(AlphaGo)等领域的突出表现而闻名。 今天给小伙伴们分享的这份手册,详尽介绍了用 Python 和 Keras进行深度学习的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。
|
7月前
|
机器学习/深度学习 算法 安全
基于YOLOv8深度学习的危险区域人员闯入检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、区域闯入
基于YOLOv8深度学习的危险区域人员闯入检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、区域闯入
|
7月前
|
机器学习/深度学习 存储 算法
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪
|
7月前
|
机器学习/深度学习 存储 计算机视觉
基于YOLOv8深度学习的PCB板缺陷检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
基于YOLOv8深度学习的PCB板缺陷检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
|
7月前
|
机器学习/深度学习 存储 编解码
基于YOLOv8与ByteTrack的车辆检测追踪与流量计数系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、车辆检测追踪、过线计数、流量统计(2)
基于YOLOv8与ByteTrack的车辆检测追踪与流量计数系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、车辆检测追踪、过线计数、流量统计
|
7月前
|
机器学习/深度学习 存储 安全
基于YOLOv8深度学习的行人跌倒检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
基于YOLOv8深度学习的行人跌倒检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
|
7月前
|
机器学习/深度学习 存储 监控
基于YOLOv8深度学习的无人机视角高精度太阳能电池板检测与分析系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割
基于YOLOv8深度学习的无人机视角高精度太阳能电池板检测与分析系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割
|
7月前
|
机器学习/深度学习 存储 监控
基于YOLOv8深度学习的高压输电线绝缘子缺陷智能检测系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标检测
基于YOLOv8深度学习的高压输电线绝缘子缺陷智能检测系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标检测