新突破!阿里云EvoQwen2.5-VL嵌入模型登顶ViDoRe榜单

简介: 近期,阿里云专有云团队基于Qwen2.5-VL-3B/7B-Instruct双基座模型,创新研发的EvoQwen2.5-VL嵌入模型,在全球顶尖开源机器学习平台Hugging Face的权威多模态检索基准ViDoRe榜单中斩获佳绩,以硬核实力刷新业界纪录。该模型以绝对优势登顶ViDoRe V2榜单全球第一,并斩获ViDoRe V1榜单全球第二。这一成果标志着在多模态语义理解与复杂检索领域,阿里云的技术实力已达到全球领先水平,为企业在高异构、非结构化数据场景下的知识管理提供了全新范式。

ViDoRe V2榜单全球第一


ViDoRe V1榜单全球第二


基于Qwen2.5-VL-3B/7B-Instruct双基座模型,阿里云专有云算法团队创新研发Evo-Retriever进化式训练框架,实现跨模态语义理解的显著跃升。


  • 图文表征优化:基于创新的LLM智能体驱动的进化式Embedding模型训练框架,可精准识别复杂文档的图文位置关系与语义关联。
  • 跨模态深度理解:能够在跨模态语义对齐、密集查询抗干扰、复杂文档布局理解等方面实现领先性能。
  • 复杂应用场景:该模型可应用于高异构、非结构化的复杂视觉文档检索、图文内容问答、多模态知识库构建等场景。


当前,该模型已集成至阿里云百炼专属版知识中心,可助力企业快速构建多模态知识库,实现非结构化数据的高效检索与智能问答。


本次突破是阿里云在多模态大模型领域长期投入的缩影,未来,阿里云会持续致力于将前沿技术转化为企业可落地的生产力工具,助力各行业实现知识管理的智能化升级。


关于ViDoRe

由Google Research与卡内基梅隆大学联合推出,是全球首个聚焦长视频与长文档深度语义对齐的顶级基准测试,突破了传统短视频简单匹配局限,基于维基百科/wikiHow等权威知识库构建真实评测体系,通过私有化隐藏测试集、国际公认评估指标及动态公开的全球排行榜机制,形成兼具保密性、公平性与透明度的多维度验证体系,被国际顶尖AI研究机构广泛采用为模型性能的基准性检测工具。

相关文章
|
机器学习/深度学习 存储 并行计算
一篇就够:高性能推理引擎理论与实践 (TensorRT)
本文分享了关于 NVIDIA 推出的高性能的深度学习推理引擎 TensorRT 的背后理论知识和实践操作指南。
15782 9
一篇就够:高性能推理引擎理论与实践 (TensorRT)
|
2月前
|
SQL 人工智能 Java
告别传统 Text-to-SQL:基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析
超越 NL2SQL,DataAgent 具备自主规划与深度分析能力,赋能企业统计分析、根因定位等复杂场景挑战。
1656 43
|
1月前
|
弹性计算 人工智能 自然语言处理
阿里云Qwen3.6全新开源,三步完成专有版部署!
Qwen3.6是阿里云全新MoE架构大模型系列,稀疏激活显著降低推理成本,兼顾顶尖性能与高性价比;支持多规格、FP8量化、原生Agent及100+语言,开箱即用。
|
3月前
|
人工智能 运维 JavaScript
Claude Code配置整合包小白友好版一键下载,只有一个需要主动操作!其他全部全自动!
Jarrod Watts 的 Claude Code 配置包,整合 Rules(自动规范)、Agents(4大助手)、Hooks(自动检查)、Commands、Skills 等六大模块,开箱即用,大幅提升 AI 编程效率与代码质量。TypeScript 优先,安装简单,新手友好,老手可按需定制。(239字)
|
4月前
|
存储 人工智能 专有云
中智集团接入飞天企业版,行业云成果入选国资委AI标杆!
近日,中智集团接入阿里云飞天企业版打造的“中智行业云”成功入选国务院国资委首批“AI战略性高价值场景”。同时,该成果凭借先进的技术架构与场景赋能价值,还获评中国信息通信研究院“面向AI的智能化专有云底座”创新应用实践,成为AI与云计算在人力资源领域的标杆应用。
242 0
|
4月前
|
专有云
山海征程|2025年阿里云专有云年度盘点
专有云的山海征程——2025年阿里云专有云年度盘点
302 0
|
4月前
|
Java Shell API
阿里云百炼 API 怎么用?2026年阿里云百炼 API 调用教程:从密钥准备到多语言实现
在使用阿里云百炼平台的大模型能力时,API 调用是核心环节 —— 无论是开发 AI 应用、测试模型效果,还是搭建智能服务,都需要通过 API 将大模型能力集成到自己的系统中。但很多开发者会困惑 “API-Key 怎么获取”“环境变量配置有什么用”“不同语言怎么写调用代码”。本文结合实操细节,用通俗语言拆解从账号准备到多语言调用的全流程,每步附具体操作和代码示例,帮助快速上手。