视觉智能开放平台的搜索结果_文章_第3页-阿里云开发者社区

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

漫画师福音！开源AI神器让线稿着色快如闪电！MagicColor：港科大开源多实例线稿着色框架，一键生成动画级彩图

MagicColor是香港科技大学推出的多实例线稿着色框架，基于扩散模型和自监督训练策略，实现单次前向传播完成多实例精准着色，大幅提升动画制作和数字艺术创作效率。

# 视觉智能开放平台 # 人工智能 # 计算机视觉

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

ACTalker：港科大联合腾讯清华推出，多模态驱动的说话人视频生成神器

ACTalker是由香港科技大学联合腾讯、清华大学研发的端到端视频扩散框架，采用并行Mamba结构和多信号控制技术，能生成高度逼真的说话人头部视频。

# 视觉智能开放平台 # 人工智能 # 语音技术

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

这个模型让AI角色会说话还会演！MoCha：Meta联手滑铁卢大学打造对话角色视频生成黑科技

MoCha是由Meta与滑铁卢大学联合开发的端到端对话角色视频生成模型，通过创新的语音-视频窗口注意力机制实现精准的唇语同步和全身动作生成。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

WorldScore：斯坦福开源世界生成模型评估新标杆：3000样本+九维指标，视频/4D/3D模型一网打尽

WorldScore是斯坦福大学提出的首个统一评估世界生成模型的基准测试，通过基于相机轨迹的布局规范和3000个多样化样本，全面评测生成内容的可控性、质量与动态性。

# 视觉智能开放平台 # 人工智能 # 测试技术 # 定位技术 # 计算机视觉 # 异构计算

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

EasyControl Ghibli是基于扩散模型的AI工具，通过条件注入技术将普通照片转化为吉卜力动画风格，仅需100张训练样本即可精准还原标志性光影与色调特征。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 缓存 # 物联网

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

DreamActor-M1是字节跳动研发的AI图像动画框架，通过混合引导机制实现高保真人物动画生成，支持多语言语音驱动和形状自适应功能。

# 视觉智能开放平台 # 人工智能 # 编解码 # 自然语言处理 # 图形学

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用，支持人物与服装照片智能合成，可生成多达10种试穿效果版本，并提供自定义提示词优化功能。

# 视觉智能开放平台 # 人工智能 # API # 计算机视觉 # 开发者 # Python

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Runway Gen-4：AI视频生成新纪元！高保真特效一键生成影视级内容

Runway Gen-4是新一代AI视频生成模型，通过参考图和文字指令即可生成具有物理真实感、叙事连贯性的高质量视频内容，支持与实拍素材无缝融合。

# 视觉智能开放平台 # 人工智能 # 算法

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

Amodal3R是一种创新的条件式3D生成模型，通过掩码加权多头交叉注意力机制和遮挡感知层，能够从部分可见的2D图像中重建完整3D形态，仅用合成数据训练即可实现真实场景的高精度重建。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 监控 # 自动驾驶 # 机器人

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

Hi3DGen是由香港中文大学、字节跳动和清华大学联合研发的高保真3D几何生成框架，通过法线图中间表示实现细节丰富的3D模型生成，其双阶段生成流程显著提升了几何保真度。

# 视觉智能开放平台 # 人工智能

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台