视觉智能开放平台的搜索结果_第18页-阿里云开发者社区

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Manga Image Translator 是一款开源的漫画图片文字翻译工具，支持多语言翻译并能将翻译后的文本无缝嵌入原图，保持漫画的原始风格和布局。该工具基于OCR技术和深度学习模型，提供批量处理和在线/离线翻译功能。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 文字识别 # 计算机视觉

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Ruyi：图森未来推出的图生视频大模型，支持多分辨率、多时长视频生成，具备运动幅度和镜头控制等功能

Ruyi是图森未来推出的图生视频大模型，专为消费级显卡设计，支持多分辨率、多时长视频生成，具备首帧、首尾帧控制、运动幅度控制和镜头控制等特性。Ruyi基于DiT架构，能够降低动漫和游戏内容的开发周期和成本，是ACG爱好者和创作者的理想工具。

# 视觉智能开放平台 # 编解码 # 人工智能 # 自然语言处理 # Python

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

BrushEdit：腾讯和北京大学联合推出的图像编辑框架，通过自然语言指令实现对图像的编辑和修复

BrushEdit是由腾讯、北京大学等机构联合推出的先进图像编辑框架，结合多模态大型语言模型和双分支图像修复模型，支持基于指令引导的图像编辑和修复。

# 自然语言处理 # 视觉智能开放平台 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # UED

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Leffa：Meta AI 开源精确控制人物外观和姿势的图像生成框架，在生成穿着的同时保持人物特征

Leffa 是 Meta 开源的图像生成框架，通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本，适用于多种扩散模型，展现了良好的模型无关性和泛化能力。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能

赣州云智科技的技术铺子

|

11月前

|

博文

|

来自：视觉智能

【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态？

【云智AI运动识别小程序插件】提供人体、运动、姿态检测的AI能力，支持本地原生识别，无需后台服务，具有速度快、体验好、易集成等优点。本文介绍如何使用该插件实现用户上传视频的运动识别，包括视频解码抽帧和人体识别的实现方法。

# 视觉智能开放平台 # 人工智能 # 小程序 # API # 开发者

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

FreeScale：无需微调即可提升模型的图像生成能力，生成 8K 分辨率的高质量图像

FreeScale是一个无需微调的推理框架，旨在提升扩散模型生成高分辨率图像和视频的能力。该框架通过处理和融合不同尺度的信息，首次实现了8K分辨率图像的生成，显著提高了生成内容的质量和保真度，同时减少了推理时间。

# 视觉智能开放平台 # 编解码 # 人工智能

赣州云智科技的技术铺子

|

11月前

|

博文

|

来自：视觉智能

uni-app开发AI康复锻炼小程序，帮助肢体受伤患者康复！

近期，多家康复机构咨询AI运动识别插件是否适用于肢力运动受限患者的康复锻炼。本文介绍该插件在康复锻炼中的应用场景，包括康复运动指导、运动记录、恢复程度记录及过程监测。插件集成了人体检测、姿态识别等功能，支持微信小程序平台，使用便捷，安全可靠，帮助康复治疗更加高效精准。

# 视觉智能开放平台 # 人工智能 # 小程序 # 数据处理 # 开发工具

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

Meta Motivo：Meta 推出能够控制数字智能体动作的 AI 模型，提升元宇宙互动体验的真实性

Meta Motivo 是 Meta 公司推出的 AI 模型，旨在控制数字智能体的全身动作，提升元宇宙体验的真实性。该模型通过无监督强化学习算法，能够实现零样本学习、行为模仿与生成、多任务泛化等功能，适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 算法 # 机器人 # 知识图谱

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

SVDQuant：MIT 推出的扩散模型后训练的量化技术，能够将模型的权重和激活值量化至4位，减少内存占用并加速推理过程

SVDQuant是由MIT研究团队推出的扩散模型后训练量化技术，通过将模型的权重和激活值量化至4位，显著减少了内存占用并加速了推理过程。该技术引入了高精度的低秩分支来吸收量化过程中的异常值，支持多种架构，并能无缝集成低秩适配器（LoRAs），为资源受限设备上的大型扩散模型部署提供了有效的解决方案。

# GPU云服务器 # 视觉智能开放平台 # 人工智能 # 物联网 # C语言 # 异构计算

游客yioxcieyrzxge

|

11月前

|

问答

|

来自：视觉智能

阿里云的图片翻译不靠谱，害得我们白充了几百大洋，反馈官方也杳无音信，果断放弃了！

# 视觉智能开放平台

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台