视觉智能开放平台

首页 标签 视觉智能开放平台
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
RF-DETR:YOLO霸主地位不保?开源 SOTA 实时目标检测模型,比眨眼还快3倍!
RF-DETR是首个在COCO数据集上突破60 mAP的实时检测模型,结合Transformer架构与DINOv2主干网络,支持多分辨率灵活切换,为安防、自动驾驶等场景提供高精度实时检测方案。
TripoSR:开源3D生成闪电战!单图0.5秒建模,Stability AI颠覆设计流程
TripoSR是由Stability AI和VAST联合推出的开源3D生成模型,能在0.5秒内从单张2D图像快速生成高质量3D模型,支持游戏开发、影视制作等多领域应用。
|
21天前
| |
来自: 视觉智能
"多路全景视频实时拼接融合"边缘计算网关几种拼接方式
本文介绍全景视频实时拼接融合边缘计算网关支持的四种前端摄像头机位部署结构:横向(180°水平)、纵向(大垂直视角)、环形外拼(360°全景)及穹顶形(最复杂)。强调需满足定焦镜头与画面重合度两大前提,目前网关已兼容前三种结构。
免费试用