Python+OpenCV创建级联文件(Windows7/10环境)

简介: Python+OpenCV创建级联文件(Windows7/10环境)


目录

1、搭建环境


2、准备数据集


3、训练级联文件


之前使用Python+OpenCV实现交通路标识别,具体实现步骤及心得如下:


OpenCV训练属于自己的xml文件,需以下几个步骤:


1、首先下载OpenCV(Windows版);      


2、准备数据集,分为正样本集和负样本集;


3、生成路径,将正样本集的路径要存成 *.vec格式;负样本集的路径不做要求,*.txt就可以;


4、训练xml文件。


1、搭建环境

OpenCV创建级联文件需要先下载OpenCV(Windows版)。


image.png


接下来傻瓜式安装操作,安装到指定路径。

image.png



安装成功后开始配置环境变量(配置环境变量比较简单,此处省略),稍后会用到OpenCV中的opencv_createsamples.exe和opencv_traincascade.exe文件训练级联文件,我的安装路径在D盘,所以设置环境变量的路径是D:\opencv\opencv\build\x64\vc15\bin。 注意:若直接在D:\opencv\opencv\build\x64\vc15\bin路径下训练模型,可以不用配置环境变量。


image.png


2、准备数据集

需要准备正样本数据集(所要识别的物体)和负样本数据集(背景图片、干扰图片),数据集数量越多种类越复杂越好。


通常正样本数据裁剪为20*20或40*40大小的像素即可(这里我使用40*40像素训练模型,9小时+可以训练完成),注意:像素过大训练速度相当慢,图片像素最好是正方形图片,长宽相等。


通常负样本数据集是识别物体的背景环境照片,图片越多越复杂抗干扰能力越强,负样本图片可以不用裁剪为固定大小,但是为了提升训练速度建议进行合理裁剪。

正样本图片如下:

image.png

负样本图片如下:


image.png


为了操作方便,我写了Python程序实现批量调整图片数据大小和图片命名,具体如下:


# -*- coding:utf8 -*-
import os
from PIL import Image
'''
批量重命名文件夹中的图片文件
'''
class BatchRename():
    def __init__(self):
        self.path = r'C:\Users\Administrator\Desktop\opencv-haar-classifier-training-master\positive_images'
    def rename(self):
        filelist = os.listdir(self.path)
        total_num = len(filelist)
        i = 0
        for item in filelist:
            if item.endswith('.jpg'):
                src = os.path.join(os.path.abspath(self.path), item)
                print(src)
                dst = os.path.join(os.path.abspath(self.path), str(i) + '.jpg')
                try:
                    os.rename(src, dst)
                    print ('converting %s to %s ...' % (src, dst))
                    i = i + 1
                except :
                    continue
        print ('total %d to rename & converted %d jpgs' % (total_num, i))
if __name__ == '__main__':
    demo = BatchRename()
    demo.rename()
'''
批量修改图片尺寸
'''
#提取目录下所有图片,更改尺寸后保存到另一目录
import os.path
import glob
def convertjpg(jpgfile,outdir,width=40,height=40):
    img=Image.open(jpgfile)
    try:
        new_img=img.resize((width,height),Image.BILINEAR)   
        new_img.save(os.path.join(outdir,os.path.basename(jpgfile)))
    except Exception as e:
        print(e)
for jpgfile in glob.glob(r"C:\Users\Administrator\Desktop\opencv-haar-classifier-training-master\positive_images\*.jpg"):
    #像素修改后存入images文件
    convertjpg(jpgfile,r"C:\Users\Administrator\Desktop\opencv-haar-classifier-training-master\images")

3、训练级联文件

1、首先按照要求创建训练文件夹

image.png



negative_images文件夹存放负样本图片。


positive_images文件夹存放正样本图片。


xml文件夹存放稍后生成的xml级联文件。


opencv_createsamples.exe负责生成*.vec文件。


opencv_traincascade.exe负责训练级联文件模型。


另外我还写了两个Python文件负责批量处理图片命名、尺寸缩小和生成对应的txt文件。


2、生成指定的txt文件路径


执行这一步之前保证文件已经命名规范,尺寸缩小到合适大小。


运行生成txt文件.py文件,生成对应的正样本路径和负样本路径文件,效果如下:


文件夹结构如下:

image.png



正样本路径文件(pos.txt)格式如下:


image.png


正样本路径文件(neg.txt)格式如下:

image.png



生成对应的txt文件Python代码如下:


import os
'''
正样本数据生成txt文件
'''
file_dir=os.getcwd()
file_dir=r'C:\Users\Administrator\Desktop\opencv-haar-classifier-training-master\positive_images'
L=[]
i=0
with open("pos.txt","w+") as f:
    for root, dirs, files in os.walk(file_dir):  
        for file in files:  
            if os.path.splitext(file)[1] == '.jpg':  
                L.append(os.path.join(root, file))
                f.write(L[i]+' 1'+' 0'+' 0'+' 40'+' 40'+'\n')
                i+=1
'''
负样本数据生成txt文件
'''
file_dir=r'C:\Users\Administrator\Desktop\opencv-haar-classifier-training-master\negative_images'
L=[]
i=0
with open("neg.txt","w+") as f:
    for root, dirs, files in os.walk(file_dir):  
        for file in files:  
            if os.path.splitext(file)[1] == '.jpg':  
                L.append(os.path.join(root, file))
                f.write(L[i]+'\n')
                i+=1  

3、获取正样本矢量集vec文件


在文件夹下新建createsamples.bat,批处理文件,内容如下:

opencv_createsamples.exe -vec pos.vec  -info pos.txt -num 1100 -w 40 -h 40
pause

其中,-vec后面是将生成的正样本矢量集vec文件,-info后面是正样本路径文件,-num后面的数字是正样本个数,-w后面的数字是正样本图片的长,-h后面的数字是正样本图片的高。


双击createsamples.bat后出现pos.vec即为运行成功。


此时文件夹结构如下:

image.png



4、训练级联文件模型


在文件夹下新建train.dat文件,内容如下:

opencv_traincascade.exe -data xml -vec pos.vec -bg neg.txt -numPos 1100 -numNeg 3205 -numStages 15 -w 40 -h 40 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -mode ALL 
pause

其中,-data 是存放训练好的分类器的路径 ,-vec 就是存放.vec的路径, -bg 负样本描述文件, -numPos 每一阶段训练的正样本数量 , -numNeg 每一阶段训练的负样本数量 (网上说-numPos的参数要比实际正样本数量小,-numNeg 的参数要比实际负样本数量大 ), -numStages 训练阶段数 (这个参数不能太大也不能太小 ,太大训练时间过长,如果太小的话 生成的xml文档分类效果可能就不太好 ), -featureType 选择LBP还是HAAR 在此选用LBP ,-w -h 训练样本尺寸 和vec生成的尺寸大小相同 不然会宕机, -minHitRate  最小命中率 ,-maxFalseAlarmRate 最大虚警率 ,最后需要在加上 -mode ALL。


此时文件夹结构如下:


image.png


双击train.bat后进入训练模式,进入漫长等待,效果如下:


image.png


最后训练完成之后级联文件保存在xml文件夹中。


image.png


其中,只有第一个cascade.xml文件是我们所需要的文件,其余文件是训练过程中生成的检查的文件,防止训练过程中出现意外程序重头训练。


下面使用Python代码进行模型测试,效果如下:


image.png


验证Python代码如下:


import numpy as np
import cv2
face_cascade = cv2.CascadeClassifier('cascade.xml')
cap = cv2.VideoCapture(0)
while True:
    ret,img = cap.read()
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    for (x,y,w,h) in faces:
        cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
    cv2.imshow('img',img)       
    if cv2.waitKey(1) &0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

最后我将模型搭建在树莓派上,发现识别效果,处理速度还是蛮不错的。  


相关文章
|
XML 存储 搜索推荐
Omnissa Dynamic Environment Manager 2503 - 个性化动态 Windows 桌面环境管理
Omnissa Dynamic Environment Manager 2503 - 个性化动态 Windows 桌面环境管理
217 7
Omnissa Dynamic Environment Manager 2503 - 个性化动态 Windows 桌面环境管理
|
7月前
|
Ubuntu 编译器 计算机视觉
Ubuntu 20.04环境下无法找到#include<opencv/cv.h>文件 - 解决方案。
希望这些信息能帮助你解决遇到的问题。
430 10
|
人工智能 安全 Shell
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
Jupyter MCP服务器基于模型上下文协议(MCP),实现大型语言模型与Jupyter环境的无缝集成。它通过标准化接口,让AI模型安全访问和操作Jupyter核心组件,如内核、文件系统和终端。本文深入解析其技术架构、功能特性及部署方法。MCP服务器解决了传统AI模型缺乏实时上下文感知的问题,支持代码执行、变量状态获取、文件管理等功能,提升编程效率。同时,严格的权限控制确保了安全性。作为智能化交互工具,Jupyter MCP为动态计算环境与AI模型之间搭建了高效桥梁。
784 2
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
|
Python
在VScode环境下配置Python环境的方法
经过上述步骤,你的VSCode环境就已经配置好了。请尽情享受这扇你为自己开启的知识之窗。如同你在冒险世界中前行,你的探索之路只有越走越广,你获得的知识只会越来越丰富,你的能力只会越来越强。
1176 37
|
安全 Windows
“由于启动计算机时出现了页面文件配置问题,Windows在你的计算机上创建了一个临时页面文件。。。”的问题解决
本文主要介绍了因清理电脑垃圾文件时误删虚拟内存导致的Windows页面文件配置问题,并提供了详细的解决步骤。问题表现为开机后出现临时页面文件创建的提示弹窗。解决方法包括通过控制面板或快捷键进入高级系统设置,进而调整虚拟内存设置:进入性能选项中的虚拟内存栏,选择自动管理所有驱动器的分页文件大小,最后确认并重启计算机以恢复正常运行。
9608 5
“由于启动计算机时出现了页面文件配置问题,Windows在你的计算机上创建了一个临时页面文件。。。”的问题解决
|
Ubuntu 数据库 虚拟化
Windows 环境下 Odoo 安装保姆级教程
本教程详细介绍了在 Windows 系统上通过虚拟机部署 Odoo 的完整流程。首先确认硬件需求,确保 CPU、内存和磁盘空间满足最低配置;接着安装 VMware Workstation Pro 并创建 Ubuntu 虚拟机,配置桥接网络以实现主机与虚拟机的通信;随后借助微聚云快速安装预配置好的 Odoo 环境,简化复杂环境搭建;最后通过浏览器访问虚拟机 IP,完成 Odoo 数据库初始化及基础设置。整个过程清晰易懂,适合新手快速上手 Odoo 部署。
1601 4
|
Shell Linux Ruby
Python3虚拟环境venv
`venv` 是 Python 的虚拟环境工具,用于为不同项目创建独立的运行环境,避免依赖冲突。通过 `python3 -m venv` 命令创建虚拟环境,并使用 `source bin/activate` 激活。激活后,所有 Python 包将安装在该环境中,不影响系统全局环境。退出环境使用 `deactivate` 命令。每个虚拟环境拥有独立的包集合,确保项目间的隔离性。删除虚拟环境只需删除其目录即可。
1582 34
|
存储 运维 监控
提升Windows Server环境安全性:ADAudit Plus的五大关键优势
在Windows Server环境中,内置的安全审计工具虽有用,但存在专业门槛高、耗时及功能缺失等问题。第三方工具ADAudit Plus应运而生,其五大优势包括:日志聚合、关键活动检测、定制化报告、灵活安全配置和长期日志保留,有效提升系统监控与合规能力。选择ADAudit Plus,助力企业更高效应对审计挑战,强化安全性。
328 2
|
Java API Docker
在线编程实现!如何在Java后端通过DockerClient操作Docker生成python环境
以上内容是一个简单的实现在Java后端中通过DockerClient操作Docker生成python环境并执行代码,最后销毁的案例全过程,也是实现一个简单的在线编程后端API的完整流程,你可以在此基础上添加额外的辅助功能,比如上传文件、编辑文件、查阅文件、自定义安装等功能。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
在线编程实现!如何在Java后端通过DockerClient操作Docker生成python环境
|
计算机视觉 Python

推荐镜像

更多