计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
26007内容
|
27天前
|
深度学习模型结构复杂、参数众多,如何更直观地深入理解你的模型?
深度学习模型虽应用广泛,但其“黑箱”特性导致可解释性不足,尤其在金融、医疗等敏感领域,模型决策逻辑的透明性至关重要。本文聚焦深度学习可解释性中的可视化分析,介绍模型结构、特征、参数及输入激活的可视化方法,帮助理解模型行为、提升透明度,并推动其在关键领域的安全应用。
告别文件迷宫!阿里云盘企业版用 AI 重构高效办公
阿里云盘企业版是专为企业用户打造的文件数据管理全面解决方案。它不仅具备强大的存储功能,还通过引入 AI 能力,为企业用户提供了语义搜索、AI 助手和知识库等智能化功能,极大地提升了文件管理的效率和便捷性。
IROS 2025 |从数字智能走向物理智能,“桃源”与真实世界机器人学习挑战赛启动,2大赛道等你来战
2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。
|
1月前
|
推荐5款我最近收集的实用小工具
本文介绍了五款实用高效工具:GIDOT TYPESETTER专业古籍排版,FlairMax智能设计增强,燃精灵微信空号检测,Epubor电子书管理,以及AI修图工具佐糖,涵盖排版、设计、营销与图像处理,助力效率提升。
|
1月前
|
Python音频特征-离散余弦变换
离散余弦变换(DCT)是一种将实数序列转换为同长度实数序列的变换,具有能量集中和去相关特性。通过实验可见,仅用少量DCT系数即可重建原始信号,达到数据压缩效果;同时DCT还能降低信号相关性,广泛应用于特征提取和音频、图像处理等领域。
AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN
本文系统回顾了计算机视觉的发展历程,从早期基于手工特征的传统方法,到深度学习的崛起与卷积神经网络(CNN)的广泛应用,并通过数学原理、代码示例与可视化手段,全面解析了卷积操作的本质与CNN的架构设计。
只需完成手画线稿,让AI算法帮你自动上色
本文介绍了如何利用图像处理技术生成手绘风格图像及自动上色的方法。内容涵盖图像灰度化、梯度调整、虚拟深度实现手绘效果,以及使用 Python 编程实现相关算法。此外,还介绍了 AI 工具 Style2Paints V4.5,其可为线稿自动上色并支持多种线稿类型,如插画和手绘铅笔稿,适用于艺术创作与图像处理领域。
自动驾驶还远吗?关键看“眼睛”
自动驾驶感知系统是智能车的“眼睛”,依赖摄像头、激光雷达、毫米波雷达等传感器实现环境感知。文章详解了感知架构、主流目标检测方法(如2D/3D检测、多传感器融合)、感知挑战(如极端天气、长尾问题)及发展趋势,并结合驭势科技实践,展示了数据闭环、BEV感知、全景分割等技术进展,推动自动驾驶向全天候、全无人目标迈进。
|
1月前
|
从原理到实践
相机标定是计算机视觉中的关键步骤,用于将真实世界的3D点映射到图像的2D平面。通过标定,可以消除镜头畸变、获取物体的真实尺寸,并实现精确的3D重建和姿态估计。标定过程通常使用棋盘格标定板,通过检测角点的3D和2D坐标来计算相机的内参矩阵和畸变系数。本文介绍了标定的原理、工具使用方法、代码解析及实际应用技巧,帮助用户高效完成标定工作。
|
1月前
| |
来自: 数据库
YOLOv8结构解读
YOLOv8是Ultralytics团队开发的最新目标检测模型,基于YOLO系列的高效单阶段架构,进一步优化了精度与速度。相比YOLOv5,YOLOv8在Backbone中移除了Focus模块,优化了CSP结构;在Neck部分增强了特征融合能力;Head部分采用Anchor-Free与解耦头设计,提升检测精度。此外,YOLOv8引入了更先进的损失函数、自对抗训练和动态标签分配等策略,显著提高了模型性能与鲁棒性。
免费试用