图像识别的搜索结果_第13页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Aria-UI：港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型，整合动作历史信息实现更加准确的定位

Aria-UI 是香港大学与 Rhymes AI 联合开发的多模态模型，专为 GUI 智能交互设计，支持高分辨率图像处理，适用于自动化测试、用户交互辅助等场景。

# 图像识别 # 人工智能 # 编解码 # 自然语言处理 # 测试技术 # 计算机视觉

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

Mobile-Agent 是一款基于多模态大语言模型的智能代理，能够通过视觉感知自主完成复杂的移动设备操作任务，支持跨应用操作和纯视觉解决方案。

# 图像识别 # XML # 人工智能 # 文字识别 # 自然语言处理 # 决策智能

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AIOpsLab：云服务自动化运维 AI，微软开源云服务 AI 框架，覆盖整个生命周期

AIOpsLab 是微软等机构推出的开源框架，支持云服务自动化运维，涵盖故障检测、根本原因分析等完整生命周期。

# 图像识别 # 人工智能 # 运维 # Prometheus # Cloud Native # API

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

MiniPerplx：基于 Grok 2.0 的开源 AI 搜索引擎，支持网页、学术、视频搜索

MiniPerplx 是一款基于 Grok 2.0 模型的开源 AI 搜索引擎，支持网页、学术论文、YouTube 视频等多种内容搜索，提供代码解释、天气预报等功能。

# 图像识别 # 人工智能 # 搜索推荐 # 前端开发 # 开发工具 # 计算机视觉

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Cosmos：英伟达生成式世界基础模型平台，加速自动驾驶与机器人开发

Cosmos 是英伟达推出的生成式世界基础模型平台，旨在加速物理人工智能系统的发展，特别是在自动驾驶和机器人领域。

# 图像识别 # 人工智能 # 自动驾驶 # 安全 # 机器人 # 开发者

aliyun1801097965

|

8月前

|

问答

|

来自： ModelScope模型即服务

关于qwen2-vl微调最佳实践

# 图像识别 # 并行计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

GeneralDyG：南洋理工推出通用动态图异常检测方法，支持社交网络、电商和网络安全

GeneralDyG 是南洋理工大学推出的通用动态图异常检测方法，通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块，有效应对数据多样性、动态特征捕捉和计算成本高等挑战。

# 图像识别 # 机器学习/深度学习 # 数据采集 # 人工智能 # 运维 # 网络安全

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

FlexRAG：不再局限于文本的 RAG！中科院开源多模态 RAG 助手，支持多数据类型、上下文压缩和多种检索器类型

FlexRAG 是中科院推出的高性能多模态 RAG 框架，支持多数据类型、上下文压缩和多模态数据处理，显著提升生成模型的表现。

# 图像识别 # 人工智能 # 自然语言处理 # 数据处理 # 数据格式 # 索引

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

MMedAgent：专为医疗领域设计的多模态 AI 智能体，支持医学影像处理、报告生成等多种医疗任务

MMedAgent 是专为医疗领域设计的多模态AI智能体，支持多种医疗任务，包括医学影像处理、报告生成等，性能优于现有开源方法。

# 图像识别 # 人工智能 # API

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

LongDocURL：中科院联合阿里推出多模态长文档理解基准数据集，用于评估模型对复杂文档分析与推理的能力

LongDocURL 是由中科院与淘天集团联合推出的多模态长文档理解基准数据集，涵盖 2,325 个问答对，支持复杂文档的理解、推理和定位任务。

# 图像识别 # 人工智能 # JSON # API # 新制造 # 数据格式

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像识别