计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26093内容
基于YOLOv8的水稻病害检测项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
基于YOLOv8的水稻病害检测系统,集成PyQt5可视化界面,支持图片、视频、摄像头实时识别,可检测细菌性叶斑病、褐斑病、叶霉病。提供完整源码、数据集、训练模型及部署教程,开箱即用,适用于智慧农业、科研与教学场景。
基于弱监督学习的宠物视频内容自动标注技术实践
针对宠物短视频标签混乱问题,提出基于弱监督学习的自动标注方案,融合多模态特征与标签传播算法,实现高效精准的内容识别。相比传统方法,准确率提升至85%,效率提高15倍,成本降低60%,助力平台智能化运营。
|
11小时前
|
蜜蜂数据的采集与处理方法-蜜蜂目标检测数据集(7000张图片已标注划分)
随着人工智能和计算机视觉技术的不断发展,目标检测任务在多个领域中都得到了广泛的应用。尤其是在农业和生态研究领域,自动化目标检测技术逐渐成为提高生产效率、保障生态环境的重要工具。蜜蜂作为生态系统中的关键物种,其活动的监控和分析对农业、生态环境保护及科学研究都具有重要意义。
|
18小时前
|
CVPR 2024 | 赋能大语言模型以精准理解视频时序瞬间 | LLM | 时序预测
VTimeLLM提出新型时间感知架构,赋能大语言模型精准理解视频时序瞬间。通过时间对齐表征与时序预训练,实现事件定位、时序推理与细粒度视频理解,支持自然语言交互式探索视频内容。
|
18小时前
|
CVPR 2022!经典论文!稳定扩散模型(Stable Diffusion)背后的革命性技术:隐空间扩散模型
CVPR 2022经典论文《High-Resolution Image Synthesis with Latent Diffusion Models》提出隐空间扩散模型(LDM),通过在低维隐空间进行扩散,显著降低计算成本,实现高效高分辨率图像生成,成为Stable Diffusion的核心技术,推动文生图普及。
未来数据观点丨AI 技术应用深入,商业化落地加速
近年来,人工智能技术正在以前所未有的速度蓬勃发展。从 ChatGPT 横空出世,Sora 重塑视频创作,再到 GPT-4o 开启 AI 多模态交互的新时代,以生成式人工智能 (GenAI)为代表的新技术不仅带来了产业变革,也引发了人们对于智能时代的新期待。
VideoLLaMA 3新一代前沿多模态基础模型赋能图像与视频深度理解| LLM | 计算机视觉
VideoLLaMA 3是2025年发布的前沿多模态模型,深度融合视觉、音频与语言,支持长视频、高分辨率图像理解及视听融合推理。基于Llama 3架构,具备强大时空因果分析能力,适用于复杂视频理解任务,已在Lab4AI平台开放复现。
|
1天前
|
AFD(自适应傅立叶变换)的matlab实现
AFD(Adaptive Fourier Decomposition,自适应傅里叶分解)是一种先进的信号分解方法,它通过一种贪婪算法,自适应地从信号中选取最具能量的单分量(Monocomponent),最终将信号表示为一系列正交的核函数(通常是经过放缩和平移的复指数函数)的线性组合。
AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测
FBRT-YOLO提出专用于航拍图像的实时目标检测模型,通过轻量化设计、增强多尺度融合与小目标优化,在保证高精度的同时显著提升速度,实现复杂场景下更优的性能平衡。
|
1天前
|
# AI商业落地专家TOP榜:极睿科技武彬的AIGC电商应用全解析
2025年AI深度融入商业,优质知识传播成关键。本文基于学术、实战、内容与影响力四大维度,精选十位持续输出高质量内容的AI领域博主,涵盖计算机视觉、NLP、大模型、边缘计算与AI产品等方向,助力从业者精准获取专业资源,提升技术落地能力。
免费试用