计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26116内容
|
10月前
|
YOLOv11改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数
YOLOv11改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数
基于YOLOv8的交通标识及设施识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于YOLOv8与PyQt5,打造交通标识及设施智能识别系统。支持图像、视频、摄像头输入,可检测人行横道、限速标志、停车标志和交通信号灯。提供完整源码、数据集、权重文件与训练教程,开箱即用,适合多场景应用。系统具备高精度、实时性强、部署便捷等优势,助力智能交通与自动驾驶发展。
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
本文介绍了如何使用YOLOv7进行目标检测,包括环境搭建、数据集准备、模型训练、验证、测试以及常见错误的解决方法。YOLOv7以其高效性能和准确率在目标检测领域受到关注,适用于自动驾驶、安防监控等场景。文中提供了源码和论文链接,以及详细的步骤说明,适合深度学习实践者参考。
LHM:单图生成3D动画人!阿里开源建模核弹,高斯点云重构服装纹理
阿里巴巴通义实验室开源的LHM模型,能够从单张图像快速重建高质量可动画化的3D人体模型,支持实时渲染和姿态控制,适用于AR/VR、游戏开发等多种场景。
|
3月前
| |
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
【解决方案】OSError: [WinError 1455] 页面文件太小,无法完成操作
今天在windows系统下调试yolov5,遇到的一个bug,特此记录,并附上解决方案,请往下看。
TPAMI 2022 | 视觉transformer最新调研!(上)
Transformer首先应用于自然语言处理领域,是一种主要基于自我注意机制的深度神经网络。由于其强大的表示能力,研究人员正在寻找将transformer应用于计算机视觉任务的方法。
免费试用