中药材图像识别数据集(100类,9200张)|适用于YOLO系列深度学习分类检测任务

简介: 本数据集包含9200张中药材图像,覆盖100种常见品类,已标注并划分为训练集与验证集,支持YOLO等深度学习模型。适用于中药分类、目标检测、AI辅助识别及教学应用,助力中医药智能化发展。

中药材图像识别数据集(100类,9200张)|适用于YOLO系列深度学习分类检测任务

随着中医药现代化和智能化进程的不断推进,如何借助人工智能技术实现中药材的快速识别与分类,已成为中医药信息化领域的重要研究方向。传统的中药材识别依赖于专家经验和人工比对,效率低下、误差较大,尤其在中药材种类繁多、外观相似度高的背景下,更加凸显自动识别技术的重要性。

近年来,深度学习特别是基于YOLO等目标检测模型的图像识别技术在工业质检、农业识别等多个领域取得显著成效,将其应用于中药图像识别同样具有广阔前景。为推动中药材智能识别的研究与落地,我们整理并发布了本数据集,涵盖 100类常见中药材图像,共计9200张样本,并完成 标准YOLO格式的标注和训练/验证集划分,可直接用于模型训练和算法测试。

本数据集可广泛应用于中药材自动识别系统开发、医药图像识别模型训练、中医药辅助教学系统等多个场景,具有较强的实用性与研究价值。

数据集已划分,共计 9200 张图片,涵盖 100 种常见中药材图像,适用于图像分类、目标检测、医学图像分析等任务。

train: train
val: val
nc: 100
names: ['安息香', '白扁豆', '白矾', '白蔹', '白茅根', '白前', '白芍', '白芷', '柏子仁', '北沙参',
        '荜拨', '荜澄茄', '鳖甲', '槟榔', '苍术', '草豆蔻', '沉香', '川楝子', '川木香', '川牛膝',
        '大腹皮', '淡豆豉', '稻芽', '地龙', '冬虫夏草', '防风', '番泻叶', '蜂房', '甘草', '干姜',
        '甘松', '藁本', '硅石脂', '枸杞子', '桂枝', '谷精草', '谷芽', '海龙', '海螵蛸', '合欢皮',
        '黄柏', '黄芪', '黄芩', '湖北贝母', '僵蚕', '芥子', '鸡冠花', '金灯笼', '鸡内金', '荆芥穗',
        '金果榄', '金钱白花蛇', '九香虫', '橘核', '苦地丁', '莱菔子', '莲房', '莲须', '莲子',
        '莲子心', '灵芝', '荔枝核', '龙眼肉', '芦根', '路路通', '麦冬', '木丁香', '羌活',
        '千年健', '秦皮', '全蝎', '忍冬藤', '人参', '肉豆蔻', '桑寄生', '桑螵蛸', '桑椹',
        '山慈菇', '山奈', '山茱萸', '沙苑子', '石榴皮', '丝瓜络', '酸枣仁', '苏木',
        '太子参', '天花粉', '天麻', '土荆皮', '瓦楞子', '五加皮', '细辛', '银柴胡',
        '薏苡仁', '郁金', '浙贝母', '枳壳', '竹茹', '诃子', '自然铜']

数据集概述

本数据集收录了来自中药材识别场景中的 100 个类别图像,总计 9200 张高质量样本图,已按照 train/val 分组格式整理,适用于主流深度学习框架(如 PyTorch、TensorFlow、YOLO 等)的训练与验证流程。图像分辨率清晰,涵盖不同拍摄角度、光照条件和背景下的实物图像,兼具真实场景复杂性与语义代表性。


数据集详情

  • 图像数量:9200 张

    • 训练集:8000 张
    • 验证集:1200 张
  • 类别数量:100 种中药材

  • 格式结构

    /train/
        └── 安息香/
        └── 白扁豆/
        ...
    /val/
        └── 安息香/
        └── 白扁豆/
        ...
    
  • 类别命名:统一为简体中文,便于中文语义处理任务,如 OCR 联合分类、多模态模型训练等。

  • 文件命名规则:自动生成,确保不重名;如 安息香_001.jpg
    image-20250712145211757本数据集共包含 9200 张中药材图像,覆盖 100 种常见中药材类别,并已按 训练集(8000张)与验证集(1200张) 合理划分。图像以标准文件夹结构进行分类存储,命名规范、无重复,全部采用 简体中文命名,便于中文任务如 OCR 联合识别、多模态预训练等应用场景。整体目录结构清晰,适配 YOLO 系列及主流视觉模型的快速加载与训练。

适用场景

本数据集可广泛应用于以下人工智能与中医药交叉领域:

  • 🌿 中药识别图像分类任务:训练 ResNet、ViT、YOLO 等模型用于分类、检测。
  • 📱 中药拍照识别App研发:作为图像识别后端训练数据,便于中药辅助查询和科普应用。
  • 🤖 医学辅助系统训练数据:结合图文进行知识联动识别。
  • 🧠 深度学习模型迁移学习训练:用于预训练或微调以增强模型对自然图像中药材的理解能力。
  • 🌐 中药材跨模态研究:如中文名称—图像联合建模、图文检索、图像标注等。

image-20250712145359020

image-20250712145509920

image-20250712145520147
本数据集适用于图像分类、目标检测、跨模态理解等多个任务场景,特别适合中药识别、医学辅助决策系统、移动端中药拍照识别App开发及AI科研训练。支持多种主流深度学习模型训练,如YOLO、ResNet、ViT等,具有较强的实用性与拓展性。

结语

中药文化源远流长,其智能识别的研究正逐步推进传统医学与人工智能的融合。本数据集立足实际拍摄与分类标准,旨在为研究者、开发者和中医药爱好者提供一份结构清晰、数据质量可靠、类别丰富的中药图像数据集,为中药AI识别迈出坚实一步。

这份《100种中药分类数据集》共包含9200张图片,涵盖100类常见中药材,已按训练集与验证集划分,结构清晰、格式统一。每类中药材图片具备多样拍摄角度和真实环境背景,适合用于图像分类、检测、OCR 联合识别等AI任务。数据集特别适用于中医药识别系统、教育类App、深度学习研究等多场景应用,是一套高质量、中文命名的实用型中药材图像数据资源。

数据集分享

如需下载该数据集,可通过以下方式获取:

  • 💾 数据集打包为 ZIP 文件,解压后即用。
https://pan.baidu.com/s/1zyL7C7byFj3VYeYnLGM2Gg?pwd=jsw8
相关文章
|
5月前
|
机器学习/深度学习 人工智能 监控
河道塑料瓶识别标准数据集 | 科研与项目必备(图片已划分、已标注)| 适用于YOLO系列深度学习分类检测任务【数据集分享】
随着城市化进程加快和塑料制品使用量增加,河道中的塑料垃圾问题日益严重。塑料瓶作为河道漂浮垃圾的主要类型,不仅破坏水体景观,还威胁水生生态系统的健康。传统的人工巡查方式效率低、成本高,难以满足实时监控与治理的需求。
|
5月前
|
机器学习/深度学习 数据采集 算法
PCB电路板缺陷检测数据集(近千张图片已划分、已标注)| 适用于YOLO系列深度学习检测任务【数据集分享】
在现代电子制造中,印刷电路板(PCB)是几乎所有电子设备的核心组成部分。随着PCB设计复杂度不断增加,人工检测PCB缺陷不仅效率低,而且容易漏检或误判。因此,利用计算机视觉和深度学习技术对PCB缺陷进行自动检测成为行业发展的必然趋势。
PCB电路板缺陷检测数据集(近千张图片已划分、已标注)| 适用于YOLO系列深度学习检测任务【数据集分享】
|
4月前
|
机器学习/深度学习 数据采集 编解码
基于深度学习分类的时相关MIMO信道的递归CSI量化(Matlab代码实现)
基于深度学习分类的时相关MIMO信道的递归CSI量化(Matlab代码实现)
210 1
|
10月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
603 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
11月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,
1120 11
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
机器学习/深度学习 人工智能 编解码
深度学习在图像识别中的革命性进展###
近年来,深度学习技术在图像识别领域取得了显著成就,极大地推动了人工智能的发展。本文探讨了深度学习模型如何通过模拟人类视觉系统来提高图像识别的准确性和效率,并分析了几种主流的深度学习架构及其在实际应用中的表现。此外,还讨论了当前面临的挑战及未来可能的发展方向。 ###
293 61
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
617 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
机器学习/深度学习 存储 自动驾驶
探索深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用,分析了其背后的原理、当前的成就以及面临的主要挑战。通过具体案例分析,揭示了深度学习模型如何从复杂的图像数据中学习到有效的特征表示,以及这些技术进步如何推动计算机视觉领域的发展。同时,文章也讨论了深度学习模型训练过程中的数据依赖性、过拟合问题、计算资源需求等挑战,并提出了未来研究的可能方向。
241 30
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
388 19

热门文章

最新文章