视觉智能开放平台的搜索结果_第17页-阿里云开发者社区

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

HelloMeme：开源的面部表情与姿态迁移框架，将视频中的人物表情迁移到静态图像中生成动态视频

HelloMeme 是一个基于 Stable Diffusion 1.5 模型的面部表情与姿态迁移框架，通过集成空间编织注意力机制，实现了自然且物理合理的表情包视频生成。该框架具有强大的泛化能力和扩展性，适用于多种应用场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

InvSR 是一个创新的图像超分辨率模型，基于扩散模型的逆过程恢复高分辨率图像。它通过深度噪声预测器和灵活的采样机制，能够高效地提升图像分辨率，适用于老旧照片修复、视频监控、医疗成像等多个领域。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 人工智能 # 监控 # 算法

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

CLEAR：新加坡国立大学推出线性注意力机制，使8K图像的生成速度提升6.3倍，显著减少了计算量和时间延迟

新加坡国立大学推出的CLEAR线性注意力机制，通过局部注意力窗口设计，显著提升了预训练扩散变换器生成高分辨率图像的效率，生成8K图像时提速6.3倍。

# GPU云服务器 # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 异构计算

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

VisionFM：通用眼科 AI 大模型，具备眼科疾病诊断能力，展现出专家级别的准确性

VisionFM 是一个多模态多任务的视觉基础模型，专为通用眼科人工智能设计。通过预训练大量眼科图像，模型能够处理多种眼科成像模态，并在多种眼科任务中展现出专家级别的智能性和准确性。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 智能设计 # 资源调度 # 数据库

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

LeviTor：蚂蚁集团开源3D目标轨迹控制视频合成技术，能够控制视频中3D物体的运动轨迹

LeviTor是由南京大学、蚂蚁集团等机构联合推出的3D目标轨迹控制视频合成技术，通过结合深度信息和K-means聚类点控制视频中3D物体的轨迹，无需显式的3D轨迹跟踪。

# 视觉智能开放平台 # 人工智能 # 数据挖掘 # vr&ar

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

StyleStudio：支持图像风格迁移的文生图模型，能将融合参考图像的风格和文本提示内容生成风格一致的图像

StyleStudio 是一种文本驱动的风格迁移模型，能够将参考图像的风格与文本提示内容融合。通过跨模态 AdaIN 机制、基于风格的分类器自由引导等技术，解决了风格过拟合、控制限制和文本错位等问题，提升了风格迁移的质量和文本对齐的准确性。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # 计算机视觉

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型，能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略，实现了色彩和风格的准确传递，适用于动画制作、游戏开发和数字艺术创作等多个领域。

# 视觉智能开放平台 # 人工智能

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Genesis：卡内基梅隆大学联合 20 多所研究机构开源生成式物理引擎，能够模拟各种材料、物体和物理运动现象

Genesis是由卡内基梅隆大学联合20多所研究机构开源的生成式物理引擎，能够模拟世界万物，具有高度的物理准确性和快速的模拟速度，适用于机器人仿真、游戏开发、电影特效制作等多个领域。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 机器人 # 异构计算

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具，支持图像和视频的多样化标注样式，适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 算法 # 计算机视觉 # 数据格式

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

ColorFlow是由清华大学和腾讯ARC实验室共同推出的图像序列着色模型，通过检索增强、上下文学习和超分辨率技术，确保黑白图像序列的着色与参考图像颜色一致，适用于漫画、动画制作等工业应用。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 人工智能 # 物联网 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台