视觉智能开放平台的搜索结果_热门_第7页-阿里云开发者社区

阿里云OpenVI

|

博文

|

【OpenVI-图像超分实战篇】别用GAN做超分了，快来试试基于扩散模型的图像超分吧！

近10年来，深度学习技术得到了长足进步，在图像增强领域取得了显著的成果，尤其是以GAN为代表的生成式模型在图像复原、老片修复，图像超分辨率等方面大放异彩。图像超分辨率是视频增强方面，用于提升画质的典型应用。生成对抗网络GAN使得在图像分辨率增加的同时，保持细节特征，补充生成真实的纹理，其中应用广泛的工作是Real-ESRGAN。扩散模型DiffusionModel在图像超分辨率这方面的新的应用，展现出其超过GAN的生成多样性和真实性。看完后，你会发现，还在用GAN做图像超分辨率吗？已经OUT了，快来试试DiffusionModel吧！

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # 达摩院 # 算法

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

阿里巴巴通义实验室开源的LHM模型，能够从单张图像快速重建高质量可动画化的3D人体模型，支持实时渲染和姿态控制，适用于AR/VR、游戏开发等多种场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # vr&ar # 决策智能 # 计算机视觉

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

UI-TARS 是字节跳动推出的新一代原生图形用户界面（GUI）代理模型，支持跨平台自动化交互，具备强大的感知、推理、行动和记忆能力，能够通过自然语言指令完成复杂任务。

# 自然语言处理 # 视觉智能开放平台 # 人工智能 # 自然语言处理 # API # 开发工具 # 开发者

阿里云OpenVI

|

博文

|

来自：视觉智能

【OpenVI-图搜系列—多模态检索实战篇】基于表征大模型的多模态检索系统

信息检索产品几乎是人们生活中必不可少的工具，经常用的有文本搜文本、图片搜图片等应用。以上任务均为单模态的检索。而多模态检索则处理涵盖原有的单模态检索任务以外，也包含跨模态检索任务，即文搜图、文搜视频等任务。要实现这一任务，则需要底层的表征模型具备图文对齐的能力，换句话说，要实现多模态检索，表征模型应实现将不同模态信息的特征映射到同一个域内，从而实现不同模态之间的相互检索。CLIP的多模态技术出现以来，给多模态检索领域带来了新的技术变革，使得实现基于通用表征大模型的大规模多模态检索系统成为可能。

# 视觉智能开放平台 # 人工智能 # 算法 # 数据处理 # 索引

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

PSHuman 是一种先进的单图像3D人像重建技术，仅需一张照片即可生成高度逼真的3D模型，支持面部细节、全身姿态和纹理恢复，适用于影视、游戏、虚拟现实等多个领域。

# 视觉智能开放平台 # 人工智能 # vr&ar

鸡蛋灌饼儿

|

问答

|

来自： ModelScope模型即服务

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

# 视觉智能开放平台 # 自然语言处理 # 对象存储

多麻辣哦

|

问答

|

来自： ModelScope模型即服务

如何下载modelscope模型？

# 视觉智能开放平台

Lethehong-44459

|

3月前

|

博文

|

来自：视觉智能

AI Ping：精准可靠的大模型服务性能评测平台

AI Ping是清华系团队推出的“大模型服务评测平台”，被誉为“AI界的大众点评”。汇聚230+模型服务，7×24小时监测性能数据，以吞吐量、延迟等硬指标助力开发者科学选型。界面简洁，数据可视化强，支持多模型对比，横向对标国内外主流平台，为AI应用落地提供权威参考。

# 视觉智能开放平台 # 人工智能 # 数据可视化 # 前端开发 # 开发者 # UED

真的很搞笑

|

问答

|

来自：视觉智能

请问一下阿里云oss有压缩视频的功能吗？

# 对象存储 # 视觉智能开放平台 # 对象存储

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

SkyReels-V1：短剧AI革命来了！昆仑开源视频生成AI秒出影视级短剧，比Sora更懂表演！

SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型，支持高质量影视级视频生成、33种细腻表情和400多种自然动作组合。

# GPU云服务器 # 视觉智能开放平台 # 数据采集 # 机器学习/深度学习 # 人工智能 # 分布式计算 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台