计算机视觉的搜索结果_第20页-阿里云开发者社区

AI研究者手札

|

3月前

|

博文

面向海洋保护的YOLOv8水下垃圾分类检测系统｜含训练与部署代码

本项目围绕海洋环境保护问题，构建了一个基于 YOLOv8 的水下垃圾目标检测系统，具备良好的实用性与可扩展性。系统集成了自定义数据训练、图形界面封装、实时检测展示等多个关键模块，能够有效识别和分类 12 类典型水下垃圾。

# 机器学习/深度学习 # 编解码 # 数据可视化 # 机器人 # 计算机视觉

AI研究者手札

|

3月前

|

博文

摊位货摊自动识别与监控系统识别系统开箱即用教程（YOLOv8）| 完整源码与部署教程

本项目展示了如何通过 YOLOv8 深度学习模型与 PyQt5 图形界面结合，开发一个摊位货摊自动识别与监控系统。该系统能够高效地检测摊位上的商品，并对周围的行为进行实时监控，为摊位管理带来极大的便利。系统支持多种输入方式，如图像、视频和摄像头，并具备异常行为检测和报警功能。

# 机器学习/深度学习 # 监控 # 算法 # 数据挖掘 # 计算机视觉

AI研究者手札

|

3月前

|

博文

基于YOLOv8的智能鼠类目标检测系统 | 室内外老鼠自动识别与追踪【含完整训练源码+部署教程】

在城市环境、食品工厂、仓储物流以及实验室等场景中，老鼠（鼠类）检测需求逐渐增加。传统的红外检测或人工排查手段存在成本高、误报多、实时性差的问题。本项目结合深度学习中的YOLOv8目标检测算法，训练了专门用于识别“老鼠”目标的模型，可快速部署至视频监控系统、摄像头终端、图像分析平台等环境中，真正实现实时、高效、准确的鼠类识别，为智能化鼠害防控系统提供核心技术支撑。

# 机器学习/深度学习 # 监控 # 算法 # 安全 # 计算机视觉

AI研究者手札

|

3月前

|

博文

基于YOLO的中医舌苔自动识别系统 | 五类舌象精准检测【含完整数据+训练源码】

本项目以 YOLOv8 为核心检测引擎，实现了对中医舌象中五类舌苔特征的高效识别，构建了一个具有实用价值的中医智能辅助诊断系统原型。项目涵盖从数据准备、模型训练到推理部署的全流程，配套图形界面（可选），实现了开箱即用、模块清晰、易于复现的目标。

# 机器学习/深度学习 # 人工智能 # 算法 # 数据可视化 # 计算机视觉

AI研究者手札

|

3月前

|

博文

多类别的家庭厨房食物、物品识别系统开箱即用教程（YOLOv8）| 完整源码与部署教程

本项目以 YOLOv8 为核心，构建了一个功能完整、部署简便的多类别家庭厨房食物与物品识别系统，支持 30 类日常厨房物品的精准识别。无论是图像、视频还是实时摄像头输入，都能实现高效检测与可视化展示。

# 机器学习/深度学习 # 人工智能 # 数据可视化 # 计算机视觉 # 智能硬件

AI研究者手札

|

3月前

|

博文

基于YOLOv8的文档图像表格检测与识别系统设计与实现（源码打包）

相比传统图像处理方法，YOLOv8 在表格检测任务中展现出更强的鲁棒性与泛化能力，尤其在复杂背景、扫描文档、低分辨率场景下依然保持高精度表现。同时，项目提供完整的训练流程与标注数据集，便于用户根据具体业务场景进行迁移学习与模型微调。

# 机器学习/深度学习 # 人工智能 # 文字识别 # 数据可视化 # 计算机视觉

游客dng4gjyb342he

|

3月前

|

博文

CFAR目标检测程序及原理详解

# 运维 # 算法 # 计算机视觉 # Python

AI研究者手札

|

3月前

|

博文

基于YOLOv8的藻类细胞实时检测识别项目｜完整源码数据集+PyQt5界面+完整训练流程+开箱即用！

本项目以 YOLOv8 为核心检测框架，结合 PyQt5 实现了一个集成化、模块化、可交互的藻类细胞实时识别系统，覆盖了从数据标注、模型训练到图形界面部署的完整流程。

# 机器学习/深度学习 # 数据可视化 # 数据挖掘 # 数据处理 # 计算机视觉

小鎏学java

|

3月前

|

博文

. Stable Diffusion 的工作流程（底层原理）

本文介绍了 Stable Diffusion 文生图模型的工作流程，包括输入文本描述、语义编码、图像生成与解码等关键步骤，揭示了 AI 如何将文字转化为图像的技术原理。

# 人工智能 # 调度 # 数据安全/隐私保护 # 计算机视觉

霍格沃兹测试开发学社

|

3月前

|

博文

国产 AI 再放大招！智谱开源 GLM-4.5V，视觉推理能力“屠榜”全球

智谱 AI 推出新一代视觉推理模型 GLM-4.5V，具备多模态融合推理、长上下文记忆与精准定位能力，在 42 个多模态榜单中斩获 41 项 SOTA。模型参数达 106B，支持图像、文本、视频输入，广泛应用于图像理解、视频分析、GUI 操作、文档解析等场景。同步开源桌面助手，助力开发者高效实现自动化任务。GLM-4.5V 以强大性能，引领国产 AI 走向全球前沿。

# 人工智能 # 前端开发 # 开发者 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

计算机视觉