视觉智能开放平台的搜索结果_第10页-阿里云开发者社区

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Sonic：自动对齐音频与唇部动作，一键合成配音动画！腾讯与浙大联合推出音频驱动肖像动画生成框架

Sonic 是由腾讯和浙江大学联合开发的音频驱动肖像动画框架，支持逼真的唇部同步、丰富的表情和头部动作、长时间稳定生成，并提供用户可调节性。

# 视觉智能开放平台 # 人工智能 # PyTorch # 算法框架/工具

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

BEN2：一键快速抠图！自动移除图像和视频中的背景，支持在线使用

BEN2 是由 Prama LLC 开发的深度学习模型，专注于从图像和视频中快速移除背景并提取前景，支持高分辨率处理和GPU加速。

# GPU云服务器 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 并行计算 # 计算机视觉 # 异构计算

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型，参数量为26亿，基于扩散模型和Transformer架构，支持多种推理求解器，能生成高质量、多风格的图像。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 自然语言处理 # 算法框架/工具

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

JoyGen：用音频生成3D说话人脸视频，快速生成逼真的唇部同步视频

JoyGen 是京东和香港大学联合推出的音频驱动的3D说话人脸视频生成框架，支持多语言、高质量视觉效果和精确的唇部与音频同步。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

DiffSplat：输入文本或图像，2秒内生成3D建模！北大联合字节开源3D建模生成框架

DiffSplat 是由北京大学和字节跳动联合推出的一个高效 3D 生成框架，能够在 1-2 秒内从文本提示或单视图图像生成高质量的 3D 高斯点阵，并确保多视图下的一致性。

# 视觉智能开放平台 # 存储 # 人工智能 # 缓存 # 图形学

游客ckeqlms2owmig

|

9月前

|

问答

|

来自： ModelScope模型即服务

关于魔塔社区里面有UI-TARS模型一件部署在阿里云的几个相关问题

# 云服务器 ECS # 视觉智能开放平台

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Qwen2.5-VL 是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。

# 视觉智能开放平台 # 人工智能 # 编解码 # JSON # 测试技术 # Linux

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

DiffuEraser：阿里通义实验室推出的视频修复模型，支持高清修复、时间一致性优化

DiffuEraser 是阿里通义实验室推出的基于稳定扩散模型的视频修复工具，能够生成丰富的细节并保持时间一致性，适用于电影修复、监控增强等场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 监控 # 网络架构

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Tarsier2：字节跳动开源专注于图像和视频内容理解的视觉语言大模型

Tarsier2 是字节跳动推出的大规模视觉语言模型，支持高质量视频描述、问答与定位，在多个视频理解任务中表现优异。

# 视觉智能开放平台 # 人工智能 # 测试技术 # 定位技术 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

UI-TARS 是字节跳动推出的新一代原生图形用户界面（GUI）代理模型，支持跨平台自动化交互，具备强大的感知、推理、行动和记忆能力，能够通过自然语言指令完成复杂任务。

# 自然语言处理 # 视觉智能开放平台 # 人工智能 # 自然语言处理 # API # 开发工具 # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台