重磅!通义千问2.5正式发布

简介: 重磅!通义千问2.5正式发布


通义大模型发布一周年之际

迎来重要的历史性时刻

阿里云正式发布通义千问2.5

并开源通义千问1100亿参数模型



通义千问2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。


同时,通义发布1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。


c335a84cce7ef33177180455822a4146.png

图|HuggingFace开源大模型排行榜


通义在多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,这款模型是国内用户规模第一的智能编码助手通义灵码的底座。


一年间,通义发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。同时原通义千问APP于今天正式宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的AI助手。


18b2e4ad3970d8e72ffcfe3a13259d50.jpg



坚定开源路线



通义是大模型开源最积极的推动者和实践者。去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源的路线,陆续推出十多款开源模型。目前,通义开源模型下载量已经超过700万。


大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。阿里云始终坚持推动大模型开源,让开发者们不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。


8d44a8538d2f3d4eef0179ca89bb90c3.png


为顺应不同场景用户的需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。


通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。


ffa4b5b6ce6f306b0be5af6a8c45ff68.png

图|生态伙伴社区反馈


阿里云CTO周靖人表示:“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。” 未来通义大模型还会持续开源。



百炼平台升级支持企业RAG


百炼平台也已从模型开发、应用开发到算力底座实现2.0全面升级,更加易用、更加开放,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。针对当下企业最关注的RAG链路,百炼提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。


38f15b60de19f9f0e9fc98802188d74b.png


2023年10月,阿里云发布了百炼大模型平台,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时“炼”出一个专属模型,把精力专注于应用创新。本次大会上,百炼升级成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。升级后,百炼可以更好支持地大型企业和成熟开发者的需求。


阿里云CTO周靖人介绍到:“当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。”


76b505e28130265c1e7937500acdfedb.png


通义灵码推出企业版


同时,通义灵码宣布推出企业版,满足企业用户的定制化需求,帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型CodeQwen1.5研发,插件下载量已超350万,每日推荐代码超3000万次,被开发者采纳的代码超亿行,是国内最受欢迎的智能编程助手。目前,通义灵码编码助手也已“入职”了多家金融、汽车、新零售、互联网等企业。


通义灵码熟练掌握Java、Python、Go、JavaScript、TypeScript、C/C++、C#等200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码等。其底层模型是通义千问团队开发的CodeQwen1.5,具备优秀的代码生成能力、长序列建模能力、代码修改能力和SQL能力,4月份刚刚登顶Big Code模型排行榜。


91334180c0a854e586fc86bb4be37eb6.png

图|Big Code模型排行榜


为满足企业客户在私域知识检索、企业数据合规、统一管理等方面的需求,通义灵码推出标准版、专属版两个企业版。标准版“开箱即用”,可以接入企业私域知识,实现私域知识问答,让AI推荐的代码更贴合企业规范;专属版在标准服务之外,提供公共云上专属实例部署、企业私有模型训练、独立企业账号系统等服务,满足大中型企业客户定制模型、节约算力的需求。


1a96ed20eeaeffb3234a8b3ce1badcf7.png



打造最受中国企业欢迎的大模型



通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。


ec43efccb760f5bebfdbbba3e15243f2.jpg


今日,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。


此前,中国一汽、新东方、长安汽车等也宣布了与通义大模型的合作成果。


通义大模型还曾“上天入地”服务客户,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。


一直以来,阿里云都强调要成为“AI时代最开放的云”,通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,开源开放战略正为阿里云带来新的商业增长。


d26cf15845372953a8fdc125b3913c48.jpg

/ END /

目录
相关文章
|
人工智能 Serverless 云栖大会
通义星尘、通义灵码、镇岳510……一文了解2023云栖重大发布!
今天,2023云栖大会进行至第2天。 本届云栖大会,我们发布了千亿级参数规模的大模型通义千问2.0、一站式模型应用开发平台阿里云百炼以及8个行业大模型,同时全面升级了人工智能平台PAI,并对超40款云产品提供了Serverless的能力,推出全球首款容器计算服务ACS。
56226 35
|
3天前
|
人工智能 自然语言处理 前端开发
什么?!通义千问也可以在线开发应用了?!
阿里巴巴推出的通义千问,是一个超大规模语言模型,旨在高效处理信息和生成创意内容。它不仅能在创意文案、办公助理、学习助手等领域提供丰富交互体验,还支持定制化解决方案。近日,通义千问推出代码模式,基于Qwen2.5-Coder模型,用户即使不懂编程也能用自然语言生成应用,如个人简历、2048小游戏等。该模式通过预置模板和灵活的自定义选项,极大简化了应用开发过程,助力用户快速实现创意。
|
1月前
|
人工智能 算法 前端开发
阿里通义灵码的最佳实践
上周首次尝试了阿里巴巴的通义灵码AI插件,体验良好。该插件体积适中,约5.8M,适合项目开发使用。其@workspace和@terminal功能强大,能快速帮助开发者熟悉新项目结构,提供智能代码导航、搜索、优化及错误提示等服务,显著提升开发效率与代码质量。实践证明,通义灵码在加速项目理解和新需求实现方面表现出色,是开发者的得力助手。
131 1
阿里通义灵码的最佳实践
|
4月前
|
SQL 人工智能 JavaScript
|
5月前
|
安全 测试技术 开发者
通义千问2.5有哪些升级
通义千问2.5有哪些升级
527 5
|
人工智能 自然语言处理 搜索推荐
2023云栖大会 | 阿里云发布通义千问2.0
今天,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0多方面性能超过GPT-3.5,正在加速追赶GPT-4。 此外,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的多方面性能已经超过GPT-3.5,加速追赶GPT-4。
2700 0
2023云栖大会 | 阿里云发布通义千问2.0
|
6月前
|
存储 人工智能 自然语言处理
阿里云的通义千问
5月更文挑战第15天
|
6月前
|
自然语言处理 搜索推荐 机器人
阿里巴巴的通义千问大模型
阿里巴巴通义千问是基于Transformer的大型语言模型,预训练于多样化数据集,支持18亿至720亿参数规模。在多模态英文任务中表现出色,且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互,提供智能体验。然而,模型在逻辑题和指令理解上存在不足,需在特定领域进行优化。
1719 1
|
6月前
|
人工智能 自然语言处理 搜索推荐
通义千问首次落地天玑9300移动平台
联发科天玑9300芯片携手阿里云通义千问大模型,实现移动端AI重大突破。通义千问在天玑9300上的高效运行,标志手机AI技术新高度,提供即时多轮对话体验。双方深度合作优化模型,通义千问18亿参数版在推理时内存占用低,速度高,为行业设定标准。双方启动AI智能体解决方案计划,推动下一代智能终端应用生态发展。高通等竞争对手也在加速大模型移动端部署,端侧AI市场竞争加剧。
290 1
通义千问首次落地天玑9300移动平台
|
6月前
|
机器人 Python
【分享】阿里版ChatGPT—通义千问(初体验)
【分享】阿里版ChatGPT—通义千问(初体验)
678 0