深度学习分类数据集小工具

简介: 深度学习分类数据集小工具

1、获取分类trian目录下各类别的图像数量


import os
dir = r"./data/train"
dirs = os.listdir(dir)
for i in range(len(dirs)):
    try:
        imgs = os.listdir(os.path.join(dir, dirs[i]))
        print(dirs[i]+":"+str(len(imgs)))
    except:
        pass

2、将train数据集按照比例随机移动至test中,还可以移动回去!


import os
import random
import cv2
import shutil
def get_txt(data_path, save_path, trainval_percent, classname, type):
    src_dir = os.path.join(data_path, classname)
    des_dir = os.path.join(save_path, classname)
    if not os.path.exists(des_dir):
        os.makedirs(des_dir)
    if type == 0:
        total_img = os.listdir(src_dir)
        num = len(total_img)
        list1 = range(num)
        tv = int(num * trainval_percent)
        trainval = random.sample(list1, tv)
        for i in range(num):
            name = total_img[i][:-4]
            if i in trainval:
                pass
            else:
                src_path = os.path.join(src_dir, name+".jpg")
                des_path = os.path.join(des_dir, name+".jpg")
                img = cv2.imread(src_path)
                print(name)
                cv2.imshow("img", img)
                cv2.waitKey(1)
                shutil.move(src_path, des_path)
    elif type == 1:
        total_img = os.listdir(des_dir)
        for i in range(len(total_img)):
            name = total_img[i][:-4]
            src_path = os.path.join(src_dir, name + ".jpg")
            des_path = os.path.join(des_dir, name + ".jpg")
            img = cv2.imread(des_path)
            cv2.imshow("img", img)
            cv2.waitKey(1)
            shutil.move(des_path, src_path)
if __name__ == '__main__':
    data_dir = r"./classify_data"
    data_path = os.path.join(data_dir, "train")
    save_path = os.path.join(data_dir, "test")
    names = os.listdir(data_path)
    className = []
    for i in range(len(names)):
        className.append(names[i])
    trainval_percent = 0.8
    for i in range(len(className)):
        get_txt(data_path, save_path, trainval_percent, className[i], 0)


 


相关文章
|
1月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的地面垃圾识别分类技术
AI垃圾分类系统结合深度学习和计算机视觉技术,实现高效、精准的垃圾识别与自动分类。系统集成高精度图像识别、多模态数据分析和实时处理技术,适用于市政环卫、垃圾处理厂和智能回收设备,显著提升管理效率,降低人工成本。
基于深度学习的地面垃圾识别分类技术
|
2月前
|
机器学习/深度学习 数据处理 数据库
基于Django的深度学习视频分类Web系统
基于Django的深度学习视频分类Web系统
66 4
基于Django的深度学习视频分类Web系统
|
3月前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
116 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
2月前
|
机器学习/深度学习 PyTorch 算法框架/工具
深度学习入门案例:运用神经网络实现价格分类
深度学习入门案例:运用神经网络实现价格分类
|
2月前
|
机器学习/深度学习 传感器 监控
深度学习之动作识别与分类
基于深度学习的动作识别与分类是指通过深度学习模型从视频或传感器数据中自动识别和分类人类动作的过程。这项技术广泛应用于视频监控、安全监控、体育分析、医疗康复、虚拟现实(VR)和增强现实(AR)等领域。
110 1
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
深度学习实践:构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行分类
本文详细介绍如何使用PyTorch构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行图像分类。从数据预处理、模型定义到训练过程及结果可视化,文章全面展示了深度学习项目的全流程。通过实际操作,读者可以深入了解CNN在图像分类任务中的应用,并掌握PyTorch的基本使用方法。希望本文为您的深度学习项目提供有价值的参考与启示。
|
4月前
|
机器学习/深度学习 JavaScript 前端开发
深度学习必备:对数据集的拆分、根据拆分图片拆分labels、对全部标注标签进行区间检查
使用JavaScript代码或浏览器扩展可以一次性在浏览器中打开多个相同的标签页。
|
4月前
|
机器学习/深度学习 人工智能 算法框架/工具
深入浅出:使用深度学习进行图像分类
【8月更文挑战第31天】在本文中,我们将一起探索如何利用深度学习技术对图像进行分类。通过简明的语言和直观的代码示例,我们将了解构建和训练一个简单卷积神经网络(CNN)模型的过程。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供清晰的指导和启发性的见解,帮助你理解并应用深度学习解决实际问题。
|
4月前
|
机器学习/深度学习 API 计算机视觉
如何使用深度学习实现图像分类
深度学习在图像分类中扮演着核心角色,通过卷积神经网络(CNN)自动提取图像特征并分类。本文介绍深度学习原理及其实现流程,包括数据准备、构建CNN模型、训练与评估模型,并讨论如何在阿里云上部署模型及其实用场景。
|
4月前
|
机器学习/深度学习 编解码 算法
Deforum:动画制作与深度学习相结合的工具
Deforum 是一个专注于将动画制作与深度学习相结合的工具,旨在简化动画创作过程,同时提高动画的质量和复杂性。Deforum 通过结合计算机视觉、深度学习、生成对抗网络(GAN)等技术,为用户提供便捷且高效的动画制作工具。
82 3