使用Numpy将数据集中的data和target同时shuffle

简介: 假设现在有图像数据imgs和对应标签targets。数据维度分别如下imgs.shape = (num, channel, width, height)targets.shape = (num, class)因为通常我们需要将数据打散,这样的好处是可以让模型训练更具鲁棒性,那么如何同时打散da...

假设现在有图像数据imgs和对应标签targets。数据维度分别如下

imgs.shape = (num, channel, width, height)
targets.shape = (num, class)

因为通常我们需要将数据打散,这样的好处是可以让模型训练更具鲁棒性,那么如何同时打散data和target,而且还需要保持对应顺序不变呢?方法如下

# 得到打乱后的index
from random import shuffle
index = [i for i in range(len(imgs))]
shuffle(index)

imgs = imgs[index, :, :, :]
targets = targets[index, :]

要注意的是数据的维度要保持正确,也就是上面的:数量要正确,假如在mnist数据集上,target的维度是(num,)维度,所以此时应该写成targets = targets[index]即可。



MARSGGBO原创





2018-10-31



目录
相关文章
|
4月前
|
存储 并行计算 数据挖掘
利用Numpy和Pandas对地铁客量数据进行实战分析(附源码)
利用Numpy和Pandas对地铁客量数据进行实战分析(附源码)
34 0
|
8月前
|
存储 缓存 数据挖掘
Python科学计算:用NumPy快速处理数据
Python科学计算:用NumPy快速处理数据
|
10月前
|
存储 数据库 索引
Python|Numpy读取本地数据和索引
Python|Numpy读取本地数据和索引
74 0
|
Python
numpy标准化数据的一个方法(belief[hallway ==1] *= 3)
numpy标准化数据的一个方法(belief[hallway ==1] *= 3)
43 0
|
Python
python计算的效率问题-pandas、numpy结合代替遍历pandas数据
python计算的效率问题-pandas、numpy结合代替遍历pandas数据
83 0
python计算的效率问题-pandas、numpy结合代替遍历pandas数据
|
算法 计算机视觉 索引
【菜菜的CV进阶之路-基础库的使用-Numpy】按指定条件筛选numpy ndarray数据并进行操作
【菜菜的CV进阶之路-基础库的使用-Numpy】按指定条件筛选numpy ndarray数据并进行操作
149 0
|
TensorFlow 算法框架/工具 Python
TensorFlow将Tensor或者numpy数据变成迭代器
TensorFlow将Tensor或者numpy数据变成迭代器
83 0
|
数据挖掘 Python
|
Python
Python使用numpy生成批量数据
Python使用numpy生成批量数据
253 0
Python语言编程学习:numpy中的array格式数据切片与pandas中的dataframe格式数据切片、相互转换
Python语言编程学习:numpy中的array格式数据切片与pandas中的dataframe格式数据切片、相互转换