备案控制台

开发者社区人工智能文章正文

mnist 数据集读取

2024-08-09 49

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【8月更文挑战第9天】mnist 数据集读取。

mnist 数据集读取
从tensorflow直接读取数据集，联网下载解压；
代码：
import os
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, optimizers, datasets
from matplotlib import pyplot as plt
import numpy as np

(x_train_raw, y_train_raw), (x_test_raw, y_test_raw) = datasets.mnist.load_data()

print(y_train_raw[0])
print(x_train_raw.shape, y_train_raw.shape)
print(x_test_raw.shape, y_test_raw.shape)

将分类标签变为onehot编码

num_classes = 10
y_train = keras.utils.to_categorical(y_train_raw, num_classes)
y_test = keras.utils.to_categorical(y_test_raw, num_classes)
print(y_train[0])
输出：
5
(60000, 28, 28) (60000,)
(10000, 28, 28) (10000,)
[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]

在mnist数据集中，images是一个形状为[60000,28,28]的张量，第一个维度数字用来索引图片，第二、三个维度数字用来索引每张图片中的像素点。在此张量里的每一个元素，都表示某张图片里的某个像素的强度值，介于0,255之间。
标签数据是"one-hot vectors",一个one-hot向量除了某一位数字是1之外，其余各维度数字都是0，如标签1可以表示为([0,1,0,0,0,0,0,0,0,0,0]),因此， labels 是一个 [60000, 10] 的数字矩阵。

文章标签：

算法框架/工具

TensorFlow

Python

索引

龙腾九州

目录

相关文章

路人贾jia

|

PyTorch 算法框架/工具索引

Pytorch学习笔记（2）：数据读取机制（DataLoader与Dataset）

Pytorch学习笔记（2）：数据读取机制（DataLoader与Dataset）

路人贾jia

741 0 0

Pytorch学习笔记（2）：数据读取机制（DataLoader与Dataset）

zzy的aly

|

2月前

|

计算机视觉

数据集学习笔记(三):COCO创建dataloader用于训练

如何使用COCO数据集创建dataloader进行训练，包括安装环境、加载数据集代码、定义数据转换、创建数据集对象以及创建dataloader。

zzy的aly

56 5 5

龙腾九州

|

5月前

|

机器学习/深度学习存储算法

MNIST数据集简介

【7月更文挑战第24天】MNIST数据集简介。

龙腾九州

210 2 2

LeoATLiang

|

机器学习/深度学习 Linux PyTorch

Dataset and DataLoader 加载数据集

Dataset and DataLoader 加载数据集

LeoATLiang

161 0 0

timerring

|

PyTorch 算法框架/工具索引

Pytorch: 数据读取机制Dataloader与Dataset

Pytorch: 数据读取机制Dataloader与Dataset

timerring

243 0 0

greework

|

机器学习/深度学习存储 PyTorch

怎么调用pytorch中mnist数据集

怎么调用pytorch中mnist数据集

greework

233 0 0

greework

|

PyTorch 算法框架/工具

【PyTorch】自定义数据集处理/dataset/DataLoader等

【PyTorch】自定义数据集处理/dataset/DataLoader等

greework

195 0 0

greework

|

存储 TensorFlow 算法框架/工具

mnist数据集预处理实战

mnist数据集预处理实战

greework

297 0 0

机器不学习我学习

|

PyTorch 算法框架/工具

【pytorch】pytorch代码中实现MNIST、cifar10等数据集本地读取

pytorch代码中实现MNIST、cifar10等数据集本地读取

机器不学习我学习

323 0 0

【pytorch】pytorch代码中实现MNIST、cifar10等数据集本地读取

shelgi

|

机器学习/深度学习移动开发 API

tensorflow2.0图片分类实战---对fashion-mnist数据集分类

tensorflow2.0图片分类实战---对fashion-mnist数据集分类

shelgi

259 0 0

tensorflow2.0图片分类实战---对fashion-mnist数据集分类

热门文章

最新文章

RDS入门——Excel文件转存到RDS数据库实践

3、Python与设计模式--建造者模式

PostgreSQL SQL HINT的使用

跟阿里云技术专家阙寒一起深度了解视频直播CDN技术

流批一体的近实时数仓的思考与设计

带你读《存储漫谈Ceph原理与实践》第三章接入层3.3.文件存储 CephFS（一）

（转载）数组a[]={3,5,2,4,1,8}，要求从a中找出所有“和”等于10的子集

linux下java 调用 c jni 实现 HelloWorld

ASP.NET MVC Music Store教程（3)：视图和视图模型

一个包含了 50+ C#/.NET编程技巧实战练习教程

使用 BenchmarkDotNet 对 .NET 代码进行性能基准测试

C#集合数据去重的5种方式及其性能对比测试分析

精选10款C#/.NET开发必备类库（含使用教程），工作效率提升利器！

.NET MongoDB数据仓储和工作单元模式封装

推荐几个不错的数据库设计工具

C#正则表达式快速入门

好消息，在 Visual Studio 中可以免费使用 GitHub Copilot 了！

3款.NET开源、功能强大的通讯调试工具，效率提升利器！

.NET 在 Visual Studio 中的高效编程技巧集

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

手把手教你白嫖阿里云服务器(免费领服务器)