计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
25999内容
|
20天前
|
基于YOLOv8的藻类细胞实时检测识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目以 YOLOv8 为核心检测框架,结合 PyQt5 实现了一个集成化、模块化、可交互的藻类细胞实时识别系统,覆盖了从数据标注、模型训练到图形界面部署的完整流程。
|
21天前
|
. Stable Diffusion 的工作流程(底层原理)
本文介绍了 Stable Diffusion 文生图模型的工作流程,包括输入文本描述、语义编码、图像生成与解码等关键步骤,揭示了 AI 如何将文字转化为图像的技术原理。
国产 AI 再放大招!智谱开源 GLM-4.5V,视觉推理能力“屠榜”全球
智谱 AI 推出新一代视觉推理模型 GLM-4.5V,具备多模态融合推理、长上下文记忆与精准定位能力,在 42 个多模态榜单中斩获 41 项 SOTA。模型参数达 106B,支持图像、文本、视频输入,广泛应用于图像理解、视频分析、GUI 操作、文档解析等场景。同步开源桌面助手,助力开发者高效实现自动化任务。GLM-4.5V 以强大性能,引领国产 AI 走向全球前沿。
|
23天前
|
C#与Halcon联合编程实现鼠标控制图像缩放、拖动及ROI绘制
C#与Halcon联合编程实现鼠标控制图像缩放、拖动及ROI绘制
|
24天前
|
深度学习模型结构复杂、参数众多,如何更直观地深入理解你的模型?
深度学习模型虽应用广泛,但其“黑箱”特性导致可解释性不足,尤其在金融、医疗等敏感领域,模型决策逻辑的透明性至关重要。本文聚焦深度学习可解释性中的可视化分析,介绍模型结构、特征、参数及输入激活的可视化方法,帮助理解模型行为、提升透明度,并推动其在关键领域的安全应用。
告别文件迷宫!阿里云盘企业版用 AI 重构高效办公
阿里云盘企业版是专为企业用户打造的文件数据管理全面解决方案。它不仅具备强大的存储功能,还通过引入 AI 能力,为企业用户提供了语义搜索、AI 助手和知识库等智能化功能,极大地提升了文件管理的效率和便捷性。
IROS 2025 |从数字智能走向物理智能,“桃源”与真实世界机器人学习挑战赛启动,2大赛道等你来战
2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。
|
29天前
|
推荐5款我最近收集的实用小工具
本文介绍了五款实用高效工具:GIDOT TYPESETTER专业古籍排版,FlairMax智能设计增强,燃精灵微信空号检测,Epubor电子书管理,以及AI修图工具佐糖,涵盖排版、设计、营销与图像处理,助力效率提升。
|
29天前
|
Python音频特征-离散余弦变换
离散余弦变换(DCT)是一种将实数序列转换为同长度实数序列的变换,具有能量集中和去相关特性。通过实验可见,仅用少量DCT系数即可重建原始信号,达到数据压缩效果;同时DCT还能降低信号相关性,广泛应用于特征提取和音频、图像处理等领域。
|
29天前
|
AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN
本文系统回顾了计算机视觉的发展历程,从早期基于手工特征的传统方法,到深度学习的崛起与卷积神经网络(CNN)的广泛应用,并通过数学原理、代码示例与可视化手段,全面解析了卷积操作的本质与CNN的架构设计。
免费试用