王者归来!F2LLM-v2再下一城,登顶MTEB泰语、西语新榜单

简介: 想拓展东南亚、欧洲、拉美海外业务的朋友有福了!F2LLM-v2 再创佳绩,一举登顶 MTEB 泰语和西班牙语两大新榜单,多语检索能力持续领跑!无论是做 RAG 知识库、语义搜索还是多语言理解,都值得收入工具箱!

就在不久前,CodeFuse 发布的 F2LLM-v2 模型家族以其在17个 MTEB 基准测试中横扫11项 SOTA 的卓越表现,赢得了社区的广泛关注和认可。

今天,我们激动地向大家宣布:F2LLM-v2 再次用实力证明了其强大的多语言能力。

全球最权威的嵌入模型评测榜单 MTEB(Massive Text Embedding Benchmark)最近推出了针对泰语和西班牙语的全新测试基准。在这两个新战场上,F2LLM-v2 不负众望,再度登顶,展现了在更多语种上的亮眼表现。

往期回顾:

横三11项榜单SOTA:高性能、全尺寸、超高效的多语嵌入模型F2LLM-v2来了


🏆 泰语新榜单:F2LLM-v2 包揽前六

在泰语排行榜上,F2LLM-v2 模型家族展现了非凡的实力,14B、8B、4B、1.7B、0.6B、330M 模型强势占据了榜首前六的位置,大幅领先于包括 12B 参数量的 KaLM-Embedding 在内的其他模型。


image.png

🏆 西班牙语新榜单:F2LLM-v2 包揽前三,稳居开源模型第一梯队

在竞争同样激烈的西班牙语榜单上,F2LLM-v2 系列模型同样表现出色,与一众顶尖模型(包括 Gemini-embedding-001 等闭源 API)同台竞技,包揽总榜前三,在开源模型中持续领跑。

image.png


路线验证:数据驱动的成果

F2LLM-v2 在泰语和西班牙语新榜单上的成功并非偶然,而是我们从一开始就坚持的“语言包容性”设计理念的必然结果。

在 F2LLM-v2 的技术报告中我们就曾提到:

“我们的数据管理流程是由真实世界的数据可用性驱动的,而不是为特定的基准测试进行优化。例如,尽管MTEB当时缺少西班牙语、阿拉伯语、意大利语等专用基准,我们的数据集中仍然包含了大量这些语言的数据。”

image.png

正是这种“先有真实世界需求,再有模型卓越能力”的研发哲学,使得 F2LLM-v2 能够在新发布的、未经过“应试”优化的语种上依然展现出 SOTA 级别的性能。这充分验证了我们训练数据的多样性和模型架构的泛化能力。


F2LLM-v2:高性能、全尺寸、超高效的多语嵌入模型

让我们再次回顾 F2LLM-v2 领先成绩背后的核心亮点:

1. 极致包容

  • 海量数据:基于6000万条高质量公开数据训练,覆盖282种自然语言和超40种编程语言。
  • 关注长尾:特别关注并增强了中、低资源语言的性能,致力于消除语言数字鸿沟。

2. 全面领先

  • SOTA收割机:在最初的17个MTEB榜单中已斩获11项第一,如今随着泰语、西语榜单的登顶,其领先地位得到进一步巩固。
  • 覆盖广泛:在代码、医疗、欧洲、斯堪的纳维亚、印度语族等多个垂直和区域性榜单上均表现卓越。

image.png

3. 高效灵活

  • 全尺寸覆盖:提供从 80M 到 14B 的8种不同尺寸模型,满足从边缘计算到企业级应用的全场景需求。
  • 前沿技术融合:结合了模型剪枝、知识蒸馏和俄罗斯套娃等技术,实现了性能与效率的最佳平衡。即使是小尺寸模型,也具备超越同级对手的强大实力。

4. 完全开源

  • 透明可复现:我们秉持开放研究的理念,已将所有模型、训练数据、代码和中间检查点完全开放,希望能为社区的研究和应用注入新的活力。


结语

F2LLM-v2在泰语和西班牙语新榜单上的卓越表现,再次印证了其作为新一代多语言嵌入模型的标杆地位。我们始终秉持着构建一个真正包容、普惠的多语言AI世界的初心,坚信 AI 的未来是多元和包容的。F2LLM-v2 将继续作为连接不同语言和文化的桥梁,赋能全球开发者和研究者。

我们诚挚地邀请您体验F2LLM-v2,共同探索多语言AI的无限可能!


传送门 🚀


关于我们

我们是蚂蚁集团的风险智能引擎团队。团队成立 4 年以来,在 ACL、EMNLP、ICLR、NeurIPS、ICML 等顶级会议发表论文 20 余篇,两次获得蚂蚁技术最高奖 T-Star ,1 次蚂蚁集团最高奖 SuperMA ,我们研发的 CodeFuse 项目连续两年蝉联学术开源先锋项目。

团队常年招聘研究型实习生,有志于大模型、Agent、强化学习、AIops、时序多模态的同学欢迎联系 wr189061@antgroup.com,期待与你一起,探索AI的无限可能!🌟



如果您想更快地获取到最新信息,欢迎加入我们的微信群。








企业用户如有需求,加入群聊时还可私聊“CodeFuse服务助手”联系解决方案专家~

目录
相关文章
|
2月前
|
前端开发 JavaScript 安全
前端组件库——Radix UI知识点大全(三)
教程来源 https://rvtst.cn/ Radix UI 是面向现代前端的无样式、高可访问性UI原语库。支持Tree Shaking、轻量Portal、CSS动画优化;提供灵活主题定制(手写CSS/Tailwind/shadcn/ui);采用复合组件、`asChild`、受控/非受控模式及完整TS支持,赋能开发者自由构建高质量界面。
|
2月前
|
前端开发 开发者
前端组件库——Radix UI知识点大全(二)
教程来源 http://yvyus.cn/ Radix UI提供50+无样式、高可访问性React原语组件,如Dialog、DropdownMenu、Popover等,内置ARIA支持、键盘导航与焦点管理,专注交互逻辑,样式完全由开发者掌控。
|
2月前
|
人工智能 缓存 API
阿里云AI节省计划是什么?如何订阅购买使用?
阿里云百炼推出AI节省计划,助开发者降本增效:通用型计划支持跨模型抵扣,承诺消费享最高5.3折;另有专属模型计划可选。覆盖Token、工具调用等费用,自动抵扣、灵活生效,显著优化大模型API调用成本。
476 7
|
2月前
|
人工智能 供应链 API
阿里云Coding Plan是什么?总是售罄怎么办?附解决攻略
阿里云Coding Plan因高性价比与顶级模型支持成开发者焦点,但Pro版每日9:30限量补货、秒罄难求。本文解析其价值,提供抢购技巧,并推荐百炼平台替代方案:免抢购、赠100万Tokens、按量付费,灵活适配各类需求。
666 5
|
6天前
|
人工智能 自然语言处理 测试技术
【阿里云官方】2026新版OpenClaw运行调试实用窍门
阿里云官方推出的OpenClaw智能助理,基于通义千问大模型,零代码3分钟即可部署。覆盖超级助理、内容创作、股票分析、一人团队、开发助手、海外运营六大场景,助力开发者高效成长、降本增效。(239字)
|
6天前
|
人工智能 自然语言处理 测试技术
【阿里云官方】六大核心场景用途:OpenClaw 智能助理平台本地环境搭建教程
阿里云官方推出的OpenClaw智能助理平台,基于通义千问大模型深度定制,覆盖超级助理、内容创作、股票分析、一人团队、开发助手、海外运营六大核心场景。支持零代码部署,3分钟即可搭建专属AI工作流,助力开发者、创作者与运营者提效降本、加速业务增长。(239字)
|
1月前
|
测试技术 UED
网站加载慢?用KKCE解决测速问题指南
本文面向零基础用户,详解网站测速的准备工作(优化网络、选定核心页面、多次取均值)、标准操作步骤及结果解读,无需专业技术即可快速掌握测速方法,精准定位加载慢问题,有效提升用户体验与转化效果。(239字)
147 8
|
2月前
|
人工智能 自然语言处理 安全
【新人快速上手使用】小白也能上手的 OpenClaw 2.6.6 安装教程(技术分享)
OpenClaw(小龙虾)是2026年热门开源「数字员工」,支持Windows一键部署(5分钟搞定),本地运行、零代码、全自动办公。无需配置环境,可整理文件、发邮件、浏览器自动化等,隐私安全,小白友好。
|
1月前
|
前端开发 数据库 数据安全/隐私保护
搭建互联网医院系统:医疗资质对接与合规建设解析
互联网医院开发难点不在界面,而在资质合规、多系统对接(HIS/EMR/医保/处方平台)与数据安全。需构建可审计的日志体系、智能接口中台及全流程加密机制,实现医疗协同而非简单线上问诊。
|
2月前
|
存储 缓存 自然语言处理
PHP的OPcache与全栈性能优化——从字节码缓存到预加载
PHP的执行过程分为四个阶段:词法/语法解析→生成抽象语法树(AST)→编译为字节码(opcodes)→执行(ZendVM)
175 9