视觉智能开放平台的搜索结果_第6页-阿里云开发者社区

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

MIDI-3D：单图秒变3D场景！40秒生成360度空间，多实例扩散黑科技

MIDI-3D 是一种先进的 AI 3D 场景生成技术，能够将单张图像快速转化为高保真度的 360 度 3D 场景，具有强大的全局感知能力和细节表现力，适用于游戏开发、虚拟现实、室内设计等多个领域。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 算法 # vr&ar # 图形学

偷心枫贼

|

6月前

|

问答

|

来自：视觉智能

视觉智能平台肢体动作接口

# 视觉智能开放平台 # Android开发 # 小程序 # iOS开发

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

VideoPainter：开源视频修复神器！双分支架构一键修复，对象身份永久在线

VideoPainter 是由香港中文大学、腾讯ARC Lab等机构联合推出的视频修复和编辑框架，基于双分支架构和预训练扩散模型，支持任意长度视频的修复与编辑，具备背景保留、前景生成、文本指导编辑等功能，为视频处理领域带来新的突破。

# 视觉智能开放平台 # 人工智能 # 物联网

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

TrajectoryCrafter：腾讯黑科技！单目视频运镜自由重构，4D生成效果媲美实拍

TrajectoryCrafter 是腾讯与香港中文大学联合推出的单目视频相机轨迹重定向技术，支持后期自由调整视频的相机位置和角度，生成高质量的新型轨迹视频，广泛应用于沉浸式娱乐、创意视频制作等领域。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

IMAGPose：南理工突破性人体生成框架！多姿态适配+细节语义融合，刷新图像生成范式

IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架，解决了传统方法在姿态引导的人物图像生成中的局限性，支持多场景适应、细节与语义融合、灵活的图像与姿态对齐以及全局与局部一致性。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 测试技术

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

AVD2：清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2 是由清华大学联合多所高校推出的自动驾驶事故视频理解与生成框架，结合视频生成与事故分析，生成高质量的事故描述、原因分析和预防措施，显著提升自动驾驶系统的安全性和可靠性。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # 自动驾驶 # 安全 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

ART：匿名区域布局+多层透明图像生成技术，生成速度比全注意力方法快12倍以上

ART 是一种新型的多层透明图像生成技术，支持根据全局文本提示和匿名区域布局生成多个独立的透明图层，具有高效的生成机制和强大的透明度处理能力。

# 视觉智能开放平台 # 人工智能 # 物联网

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

MIT颠覆传统！分形生成模型效率暴涨4000倍，高分辨率图像秒级生成

Fractal Generative Models 是麻省理工学院与 Google DeepMind 团队推出的新型图像生成方法，基于分形思想，通过递归调用模块构建自相似架构，显著提升计算效率，适用于高分辨率图像生成、医学图像模拟等领域。

# 视觉智能开放平台 # 人工智能 # 编解码 # 数据建模 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

VidSketch：手残党逆袭！浙大AI神器草图秒变4K动画，三连提示词玩转影视级特效

VidSketch 是浙江大学推出的创新视频生成框架，通过手绘草图和简单文本提示生成高质量视频动画，降低视频创作的技术门槛，满足多样化的艺术需求。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

VideoGrain：零样本多粒度视频编辑神器，用AI完成换装改场景，精准控制每一帧！

VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架，基于调节时空交叉注意力和自注意力机制，实现类别级、实例级和部件级的精细视频修改，保持时间一致性，显著优于现有方法。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台