数据集介绍

简介: 【8月更文挑战第9天】数据集介绍。

数据集介绍
1). MNIST数据集来自美国国家标准与技术研究所(National Institute of Standards and Technology ,简称NIST);
2). 该数据集由来自250个不同人手写的数字构成,其中50%是高中学生,50%来自人口普查局的工组人员;
3). 数据集可在http://yann.lecun.com/exdb/mnist/ 获取, 它包含了四个部分:

- Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)
- Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)
- Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)
- Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)

4). mnist是一个入门级的计算机视觉数据集,它包含各种手写数字图片:

它也包含每一张图片对应的标签,告诉我们这个是数字几,比如说,上面这四张图片的标签分别是5,0,4,1。

相关文章
【yolo训练数据集】标注好的垃圾分类数据集共享
【yolo训练数据集】标注好的垃圾分类数据集共享
2289 137
【yolo训练数据集】标注好的垃圾分类数据集共享
|
2月前
|
PyTorch 算法框架/工具
数据集学习笔记(三):调用不同数据集获取trainloader和testloader
本文介绍了如何使用PyTorch框架调用CIFAR10数据集,并获取训练和测试的数据加载器(trainloader和testloader)。
43 4
数据集学习笔记(三):调用不同数据集获取trainloader和testloader
|
4月前
|
计算机视觉
数据集介绍
【8月更文挑战第8天】数据集介绍。
40 1
|
4月前
分割数据集,并对数据集进行预处理
【8月更文挑战第8天】分割数据集,并对数据集进行预处理。
39 1
|
5月前
|
机器学习/深度学习 数据采集 存储
数据集
【7月更文挑战第10天】数据集
359 1
|
5月前
|
机器学习/深度学习 自然语言处理 算法
什么是数据集的分类?
【7月更文挑战第10天】什么是数据集的分类?
621 1
|
XML 数据挖掘 数据格式
|
6月前
鸢尾花数据集分类问题(3)
鸢尾花数据集分类问题
36 2
|
6月前
|
机器学习/深度学习
鸢尾花数据集分类问题(2)
鸢尾花数据集分类问题
43 1
|
6月前
鸢尾花数据集分类问题(1)
鸢尾花数据集分类问题
43 1