视觉智能开放平台的搜索结果_热门_第5页-阿里云开发者社区

阿里云OpenVI

|

博文

|

信息检索产品几乎是人们生活中必不可少的工具，经常用的有文本搜文本、图片搜图片等应用。以上任务均为单模态的检索。而多模态检索则处理涵盖原有的单模态检索任务以外，也包含跨模态检索任务，即文搜图、文搜视频等任务。要实现这一任务，则需要底层的表征模型具备图文对齐的能力，换句话说，要实现多模态检索，表征模型应实现将不同模态信息的特征映射到同一个域内，从而实现不同模态之间的相互检索。CLIP的多模态技术出现以来，给多模态检索领域带来了新的技术变革，使得实现基于通用表征大模型的大规模多模态检索系统成为可能。

# 视觉智能开放平台 # 人工智能 # 算法 # 数据处理 # 索引

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

UI-TARS 是字节跳动推出的新一代原生图形用户界面（GUI）代理模型，支持跨平台自动化交互，具备强大的感知、推理、行动和记忆能力，能够通过自然语言指令完成复杂任务。

# 自然语言处理 # 视觉智能开放平台 # 人工智能 # 自然语言处理 # API # 开发工具 # 开发者

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

阿里巴巴通义实验室开源的LHM模型，能够从单张图像快速重建高质量可动画化的3D人体模型，支持实时渲染和姿态控制，适用于AR/VR、游戏开发等多种场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # vr&ar # 决策智能 # 计算机视觉

汀丶人工智能

|

博文

|

来自：视觉智能

阿里视觉智能开放平台（灵杰AI开放服务）【评测】人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

阿里视觉智能开放平台（灵杰AI开放服务）DetectLivingFace 人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

# 文字识别 # 视觉智能开放平台 # 存储 # 机器学习/深度学习 # 人工智能 # 编解码 # 缓存 # 文字识别 # 安全 # 算法 # API # 计算机视觉

鸡蛋灌饼儿

|

问答

|

来自： ModelScope模型即服务

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

# 视觉智能开放平台 # 自然语言处理 # 对象存储

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

ModelScope魔搭上的可以直接调用api用吗？

# 视觉智能开放平台 # API

游客yqdu5djlmwbso

|

1月前

|

博文

|

来自：视觉智能

机器视觉软件平台哪个好：2025领衔的选型指南

本文基于权威报告，对比苏州德创、康耐视、凌云光、海康机器人、基恩士五大机器视觉软件平台，从算法能力、易用性、兼容性及教学工业适配性等维度分析，为选型提供可溯源依据。德创VisionPlus国产全栈适配，教学与工业双优。附选购指南，助力精准决策。

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # 机器人 # 数据挖掘 # 图形学

三分钟热度的鱼

|

问答

|

来自：视觉智能

OCR发票识别不到？

# 文字识别 # 视觉智能开放平台 # 文字识别

真的很搞笑

|

问答

|

来自：视觉智能

OCR营业执照识别失败什么原因？

# 文字识别 # 视觉智能开放平台 # 文字识别 # API

思绪无限

|

博文

|

来自：视觉智能

基于深度学习的人脸识别与管理系统（UI界面增强版，Python代码）

# 视觉智能开放平台 # 机器学习/深度学习 # 存储 # 算法 # 机器人 # 数据挖掘 # 数据库 # 计算机视觉 # C++ # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台