计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26265内容
YOLO26改进 - 注意力机制 | 多扩张通道细化器MDCR 通过通道划分与异构扩张卷积提升小目标定位能力
本文介绍了一种在YOLO26目标检测模型中引入高效解码器模块EMCAD的创新方法,以提升模型在资源受限场景下的性能与效率。EMCAD由多个模块构成,其中核心的EUCB(高效上卷积块)通过上采样、深度可分离卷积、激活归一化和通道调整等操作,兼顾了特征质量与计算成本。实验结果显示,该模块在显著减少参数与FLOPs的同时仍具备优异性能。文章还提供了完整的YOLO26模型集成流程、配置和训练实战。
|
19天前
|
基于 YOLOv8 的河道漂浮垃圾智能检测|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于YOLOv8构建河道漂浮垃圾智能检测系统,集成PyQt5可视化界面,支持图片/视频/摄像头实时检测。提供完整源码、标注数据集、训练权重及详细教程,开箱即用,适用于环保监测、智慧水务等场景。
从单体应用到 Serverless:一款图片处理小程序的架构取舍与技术演进
作为一名独立开发者,在构建图像处理应用时,往往面临着“既要又要”的诱惑:既想做视频处理,又想做图像修复,还想做风格迁移。然而,资源是有限的,算力是昂贵的。 本文将以**“香蕉一键去水印”**这款小程序为例,从技术架构的角度探讨:如何通过严格的“功能剪裁”和“算法优化”,在微信小程序这一轻量级载体上实现工业级的图像修复效果
|
21天前
|
基于 YOLOv8 的包装箱纸板破损缺陷检测系统 [目标检测完整源码]
本项目基于YOLOv8构建工业级纸板破损缺陷检测系统,支持裂纹、孔洞、压痕等多类缺陷识别。含完整源码、预训练模型、标注数据集及PyQt5可视化界面,开箱即用,mAP@0.5达90%,满足产线实时质检需求
|
22天前
|
基于 YOLOv8 的二维码智能检测系统 [目标检测完整源码]
本项目基于YOLOv8构建二维码智能检测系统,专为复杂场景(倾斜、遮挡、反光、小目标等)设计。含完整数据集、训练代码、预训练模型及PyQt5图形界面,支持图片/视频/摄像头实时检测,开箱即用,兼具高精度与工程落地性。
别人的模型准确率95%,我的怎么调都卡在85%…
大家好,我是AI技术博主maoku!本文带你告别“调参玄学”,系统拆解微调核心参数(学习率、Batch Size、优化器、正则化、早停)的原理与实操,配CIFAR-10实战代码,助你从“小白”进阶为懂原理、会诊断、能优化的“参数医生”。
YOLO26改进 - SPPF模块 | SPPELAN 空间金字塔池化与增强局部注意力:替代SPPF增强多尺度上下文捕获,提升检测精度
本文提出可编程梯度信息(PGI)与通用高效层聚合网络(GELAN),解决深度网络中信息丢失问题。PGI确保梯度计算时输入信息完整,提升模型训练效果;GELAN基于梯度路径规划,实现高效轻量架构。结合SPPELAN模块应用于YOLO26,在MS COCO任务中显著提升参数利用率与检测性能,无需预训练即超越现有先进模型。
YOLO26改进 - C2PSA | C2PSA融合TSSA(Token Statistics Self-Attention)令牌统计自注意力,优化遮挡目标感知
本文提出Token统计自注意力(TSSA),通过动态分组与低秩投影实现线性复杂度注意力机制。基于MCR²目标推导,摒弃传统成对相似度计算,显著提升效率。集成于YOLO26的C2PSA模块后,实验验证其在目标检测中性能优越,代码已开源。
|
22天前
|
基于 YOLOv8 的多犬种(60种常见犬类)智能识别系统项目 [目标检测完整源码]
基于YOLOv8的多犬种智能识别系统,覆盖60种常见犬类,实现高精度目标检测。项目包含完整数据集、训练代码与预训练模型,支持图片、视频及摄像头实时检测,并配备PyQt5桌面GUI,开箱即用。适用于宠物管理、AI应用落地与二次开发,是算法到应用一体化的工程实践典范。
YOLO26 改进 - C2PSA | C2PSA融合MSLA多尺度线性注意力:并行多分支架构融合上下文语义,提升特征判别力 | Arxiv 2025
本文提出多尺度线性注意力机制MSLA,通过并行3×3/5×5/7×7/9×9深度卷积提取多尺度特征,结合低复杂度线性注意力(O(N)),兼顾细粒度局部细节与全局长程依赖。将其集成至YOLO26,构建C2PSA_MSLA模块,在医学图像分割与目标检测任务中显著提升性能、效率与鲁棒性。(239字)
免费试用