通义千问 Qwen 衍生模型包揽 HuggingFace 开源榜单全球前十!

简介: 通义千问 Qwen 衍生模型包揽 HuggingFace 开源榜单全球前十!

近日,全球最大AI开源社区 Huggingface 发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于通义千问 Qwen 开源模型二次训练的衍生模型。

图源 Huggingface2月10日官网榜单截图


这一榜单被广泛视为全球最具权威性的开源大模型评测榜单,涵盖了阅读理解、逻辑推理、数学计算、事实问答等多个测试维度,根据综合性能表现进行模型排名。



Qwen系列衍生模型数量突破9万


通义千问 Qwen 大模型已经成为全球最大的开源模型族群


在海内外开源社区中,Qwen 的衍生模型数量已突破9万,超越美国 Meta 公司旗下的 Llama 系列开源模型,位居全球第一。在 Hugging face 2024年的开源模型下载中,Qwen 模型系列中的 Qwen2.5-1.5B-Instruct 的下载量占总下载量的 26.6%,是全球下载量最高的开源模型。


自2023年8月以来,我们先后开源了 Qwen、Qwen1.5、Qwen2、Qwen2.5 等多个版本,覆盖大语言模型、多模态模型、数学模型、代码模型等多个领域。Qwen 系列模型多次登上国内外权威大模型榜单,成为开源社区的重要组成部分。


欢迎大家前往 Qwen Chatchat.qwenlm.ai)免费体验模型,或是通过阿里云百炼调用 Qwen 模型的 API 服务,敬请期待更多 Qwen 模型。

相关文章
|
23天前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
220 120
|
21天前
|
缓存 物联网 PyTorch
使用TensorRT LLM构建和运行Qwen模型
本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型,涵盖模型转换、引擎构建、量化推理及LoRA微调等操作,并提供详细的代码示例与支持矩阵。
239 2
|
1月前
|
存储 机器学习/深度学习 人工智能
54_模型优化:大模型的压缩与量化
随着大型语言模型(LLM)的快速发展,模型规模呈指数级增长,从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本,同时也给部署和推理带来了巨大挑战。2025年,大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践,探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署,为企业和开发者提供全面的技术指导。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
38_多模态模型:CLIP的视觉-语言对齐_深度解析
想象一下,当你看到一张小狗在草地上奔跑的图片时,你的大脑立刻就能将视觉信息与"小狗"、"草地"、"奔跑"等概念联系起来。这种跨模态的理解能力对于人类来说似乎是理所当然的,但对于人工智能系统而言,实现这种能力却经历了长期的技术挑战。多模态学习的出现,标志着AI从单一模态处理向更接近人类认知方式的综合信息处理迈出了关键一步。
|
2月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
575 109
|
2月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
206 2
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1112 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
3月前
|
存储 人工智能 自然语言处理
告别文字乱码!全新文生图模型Qwen-Image来咯
通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。
581 2

热门文章

最新文章