视觉智能开放平台的搜索结果_第13页-阿里云开发者社区

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

JoyCaption：开源的图像转提示词生成工具，支持多种风格和场景，性能与 GPT4o 相当

JoyCaption 是一款开源的图像提示词生成工具，支持多种生成模式和灵活的提示选项，适用于社交媒体、图像标注、内容创作等场景，帮助用户快速生成高质量图像描述。

# 视觉智能开放平台 # 人工智能 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

SeedVR：高效视频修复模型，支持任意长度和分辨率，生成真实感细节

SeedVR 是南洋理工大学和字节跳动联合推出的扩散变换器模型，能够高效修复低质量视频，支持任意长度和分辨率，生成真实感细节。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 人工智能 # 测试技术 # Python

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

SPRIGHT：提升文本到图像模型空间一致性的数据集

SPRIGHT 是一个专注于空间关系的大型视觉-语言数据集，通过重新描述600万张图像，显著提升文本到图像模型的空间一致性。

# 视觉智能开放平台 # 人工智能 # 并行计算 # PyTorch # 算法框架/工具 # vr&ar

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

RealisHuman：AI 生成的人像不真实？后处理框架帮你修复生成图像中畸形人体部位

RealisHuman 是一个创新的后处理框架，专注于修复生成图像中畸形的人体部位，如手和脸，通过两阶段方法提升图像的真实性。

# 视觉智能开放平台 # 人工智能

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

AddressCLIP 是由中科院和阿里云联合开发的端到端图像地理定位模型，通过图像-文本对齐和地理匹配技术，实现街道级精度的定位，适用于城市管理、社交媒体、旅游导航等场景。

# 视觉智能开放平台 # 人工智能 # 搜索推荐 # 定位技术 # 计算机视觉

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

CreatiLayout：复旦与字节联合推出布局到图像生成技术，支持高质量图像生成与布局优化

CreatiLayout 是复旦大学与字节跳动联合推出的创新布局到图像生成技术，通过大规模数据集和孪生多模态扩散变换器，实现高质量图像生成与布局优化。

# 视觉智能开放平台 # 人工智能

游客z2kfhh7zefrtm

|

10月前

|

问答

|

来自：视觉智能

票据凭证识别->混贴发票识别，提供的发票地址公网可以访问，依旧报错，怎么处理？

# 视觉智能开放平台

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

PersonaMagic：人像与风格融合！快速生成个性化的头像

PersonaMagic 是一种创新的高保真人脸定制技术，通过阶段调节的文本条件策略和动态嵌入学习，能够根据单张图像生成个性化角色，广泛应用于娱乐、游戏、影视等领域。

# 视觉智能开放平台 # 人工智能 # 搜索推荐

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

LatentSync：根据音频生成高分辨率、动态逼真的唇形同步视频

LatentSync 是由字节跳动与北京交通大学联合推出的端到端唇形同步框架，基于音频条件的潜在扩散模型，能够生成高分辨率、动态逼真的唇同步视频，适用于影视、教育、广告等多个领域。

# 视觉智能开放平台 # 人工智能 # 数据处理

p4bvykgu6pzx2

|

10月前

|

问答

|

来自：视觉智能

OCR入参图片链接不支持 OSS 带有效时间的图片链接？

# 对象存储 # 视觉智能开放平台 # 对象存储 # 文字识别

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台