深度学习实战 fashion-mnist数据集预处理技术分析

简介: 深度学习实战 fashion-mnist数据集预处理技术分析

keras的fashion-mnist数据集的源码为:


def load_data():

   """Loads the Fashion-MNIST dataset.

   # Returns

       Tuple of Numpy arrays: `(x_train, y_train), (x_test, y_test)`.

   """

   dirname = os.path.join('datasets', 'fashion-mnist')

   base = 'http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/'

   files = ['train-labels-idx1-ubyte.gz', 'train-images-idx3-ubyte.gz',

            't10k-labels-idx1-ubyte.gz', 't10k-images-idx3-ubyte.gz']


   paths = []

   for fname in files:

       paths.append(get_file(fname,

                             origin=base + fname,

                             cache_subdir=dirname))


   with gzip.open(paths[0], 'rb') as lbpath:

       y_train = np.frombuffer(lbpath.read(), np.uint8, offset=8)


   with gzip.open(paths[1], 'rb') as imgpath:

       x_train = np.frombuffer(imgpath.read(), np.uint8,

                               offset=16).reshape(len(y_train), 28, 28)


   with gzip.open(paths[2], 'rb') as lbpath:

       y_test = np.frombuffer(lbpath.read(), np.uint8, offset=8)


   with gzip.open(paths[3], 'rb') as imgpath:

       x_test = np.frombuffer(imgpath.read(), np.uint8,

                              offset=16).reshape(len(y_test), 28, 28)


   return (x_train, y_train), (x_test, y_test)


fashion-mnist数据集以四个gzip格式的方式存储在远程服务器上,利用keras的get_file()下载到本地的keras缓存目录。


然后利用gzip的open()打开文件,利用numpy的frombuffer方法直接加载numpy的数组。如果是图像数据的话,需要进行reshape操作。


此处,为什么加载图片数据的时候需要offset=16,标签数据的时候需要offset=8?


fashion-mnist图像数据集的预处理方式和mnist有很大的不同,四个gz文件分别存放了x_train, y_train, x_test, y_test四个部分,然后分别读取四个文件利用np.frombuffer()方式加载。这种处理方式相对mnist来说复杂一些。为什么会这样处理?


目录
相关文章
|
3天前
|
机器学习/深度学习
深度学习在医疗影像分析中的应用与挑战
随着深度学习技术的迅速发展,其在医疗影像分析领域展现出巨大的潜力和价值。本文将深入探讨深度学习如何革新医疗影像诊断流程,提高诊断的准确性与效率。通过引用最新的科研数据和实验证据,本文旨在揭示深度学习模型在处理复杂的医疗影像数据时的优势及面临的主要技术挑战。同时,文章还将讨论深度学习技术在未来医疗健康领域的应用前景以及可能的发展方向。
|
6天前
|
机器学习/深度学习 人工智能 算法
深度学习在医疗影像分析中的应用与挑战
本文深入探讨了深度学习技术在医疗影像分析领域的应用现状和面临的主要挑战。文章首先概述了深度学习技术的基本原理及其在医疗影像处理中的重要性,随后详细分析了深度学习模型在图像分类、病变检测和诊断辅助等方面的具体应用案例。此外,文章还讨论了数据隐私、模型泛化能力以及临床部署等关键挑战,并提出了未来研究的方向。通过综合分析,旨在为医疗影像分析领域的研究者和从业者提供深度学习技术的应用指南和挑战应对策略。
|
8天前
|
机器学习/深度学习 算法 数据安全/隐私保护
深度学习在医疗影像分析中的应用与挑战
本文将深入探讨深度学习技术在医疗影像分析领域的应用现状和面临的挑战。通过分析深度学习模型在图像识别、分类和分割任务中的表现,以及其在辅助诊断、疾病监测和治疗规划中的实际案例,我们将揭示这一技术的潜力与局限性。同时,文章还将讨论数据隐私、模型泛化能力和跨域适应性等问题,为未来研究提供方向。
|
10天前
|
机器学习/深度学习 算法 数据安全/隐私保护
深度学习在医疗影像分析中的应用与挑战
【6月更文挑战第21天】随着人工智能技术的飞速发展,深度学习已成为推动医学影像分析进步的关键力量。本文将探讨深度学习技术如何革新医疗影像的诊断流程,包括自动化病变检测、图像分割以及疾病预测等方面。同时,我们将讨论实施这些技术时遇到的伦理和法律问题。
|
11天前
|
机器学习/深度学习 人工智能 算法
深度学习在医疗影像分析中的创新应用
【6月更文挑战第20天】随着人工智能的迅猛发展,深度学习技术在医疗影像分析领域展现出了前所未有的潜力。本文将深入探讨深度学习如何革新传统的医疗影像处理流程,包括图像分类、检测和分割等任务。我们将介绍一些最新的研究成果,展示深度学习模型如何助力医生进行更快速、更准确的诊断,并讨论这一技术面临的挑战与未来的发展方向。
18 3
|
14天前
|
机器学习/深度学习 自然语言处理 供应链
深度学习在大数据分析中的应用非常广泛
深度学习在大数据分析中的应用非常广泛
|
15天前
|
机器学习/深度学习 数据采集 人工智能
深度学习在医疗影像分析中的应用与未来展望
深度学习技术近年来在医疗影像分析领域取得了显著进展,通过自动化处理和高度准确的诊断能力,极大地提升了疾病检测和治疗的效率。本文探讨了当前深度学习在医疗影像分析中的应用现状,具体案例,以及未来可能的发展方向和面临的挑战。
28 3
|
17天前
|
机器学习/深度学习 计算机视觉
深度学习在医疗影像分析中的应用
【6月更文挑战第14天】随着人工智能技术的飞速发展,深度学习已经在许多领域取得了突破性的进展。特别是在医疗影像分析领域,深度学习技术的应用为医生提供了更准确、更高效的诊断工具。本文将探讨深度学习在医疗影像分析中的应用及其优势。
|
18天前
|
机器学习/深度学习 自然语言处理 前端开发
深度学习-[源码+数据集]基于LSTM神经网络黄金价格预测实战
深度学习-[源码+数据集]基于LSTM神经网络黄金价格预测实战
|
18天前
|
机器学习/深度学习 自然语言处理 前端开发
深度学习-[数据集+完整代码]基于卷积神经网络的缺陷检测
深度学习-[数据集+完整代码]基于卷积神经网络的缺陷检测