视觉智能开放平台的搜索结果_文章_第14页-阿里云开发者社区

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

DiffSplat：输入文本或图像，2秒内生成3D建模！北大联合字节开源3D建模生成框架

DiffSplat 是由北京大学和字节跳动联合推出的一个高效 3D 生成框架，能够在 1-2 秒内从文本提示或单视图图像生成高质量的 3D 高斯点阵，并确保多视图下的一致性。

# 视觉智能开放平台 # 存储 # 人工智能 # 缓存 # 图形学

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL 是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。

# 视觉智能开放平台 # 人工智能 # 编解码 # JSON # 测试技术 # Linux

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

DiffuEraser：阿里通义实验室推出的视频修复模型，支持高清修复、时间一致性优化

DiffuEraser 是阿里通义实验室推出的基于稳定扩散模型的视频修复工具，能够生成丰富的细节并保持时间一致性，适用于电影修复、监控增强等场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 监控 # 网络架构

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Tarsier2：字节跳动开源专注于图像和视频内容理解的视觉语言大模型

Tarsier2 是字节跳动推出的大规模视觉语言模型，支持高质量视频描述、问答与定位，在多个视频理解任务中表现优异。

# 视觉智能开放平台 # 人工智能 # 测试技术 # 定位技术 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

UI-TARS 是字节跳动推出的新一代原生图形用户界面（GUI）代理模型，支持跨平台自动化交互，具备强大的感知、推理、行动和记忆能力，能够通过自然语言指令完成复杂任务。

# 自然语言处理 # 视觉智能开放平台 # 人工智能 # 自然语言处理 # API # 开发工具 # 开发者

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

X-Dyna：一张图片就能实现动画化！字节联合斯坦福推出动画生成框架

X-Dyna 是由字节跳动联合斯坦福等高校推出的动画生成框架，基于扩散模型实现单张图像动画化，支持面部表情和身体动作控制，生成高质量动态细节。

# 视觉智能开放平台 # 传感器 # 人工智能

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

VideoWorld：字节开源自回归视频生成模型，支持输入视频指导AI生成视频！弥补文本生成视频的短板

VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型，能够从未标注的视频数据中学习复杂知识，支持长期推理和规划任务。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 监控 # 机器人

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，支持文生视频、图生视频，最高支持4K分辨率，广泛应用于内容创作、教育、广告等领域。

# 视觉智能开放平台 # 人工智能 # 编解码

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

PSHuman 是一种先进的单图像3D人像重建技术，仅需一张照片即可生成高度逼真的3D模型，支持面部细节、全身姿态和纹理恢复，适用于影视、游戏、虚拟现实等多个领域。

# 视觉智能开放平台 # 人工智能 # vr&ar

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

CogView-3-Flash：智谱首个免费AI图像生成模型，支持多种分辨率，快速生成创意图像

CogView-3-Flash 是智谱推出的首个免费AI图像生成模型，支持多种分辨率，快速生成高质量图像，广泛应用于广告、设计、艺术创作等领域。

# 视觉智能开放平台 # 人工智能 # 编解码 # 自然语言处理 # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台