首批!通义千问通过国家大模型标准评测

简介: 首批!通义千问通过国家大模型标准评测


今天,在刚刚结束的全国信息技术标准化技术委员会人工智能分委会全体会议上,多个好消息传来!


国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。


同时,MaaS模型服务相关标准正式启动编制,作为首个在业界提出MaaS理念的企业,阿里云将以技术牵头方的身份持续贡献我们的想法和实践经验



01

基础大模型通义千问,首批通过国家大模型标准符合性评测


“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。



本次通过评测的首批大模型中,通义千问是唯一的开源模型,在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜,此后又登上国内上海人工智能实验室OpenCompass榜首,成为业界公认的性能最强开源大模型。


目前,通义千问APP可在苹果和安卓各大应用商店中下载体验,提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。


02

持续推进模型服务,作为技术牵头方启动MaaS相关标准编制


去年10月,阿里云在业界首次提出模型即服务MaaS理念,并发布AI模型社区“魔搭”。一年多后,市场对模型服务需求高涨,MaaS已成为全球云厂商升级部署的重要技术方向, 同时“魔搭”成为中国规模最大、最活跃的模型社区,开发者数突破280万,模型下载量破亿。


为推动MaaS领域的标准化工作,促进产业发展,在刚结束的全国信标委人工智能分委会全体会议上,《人工智能 模型即服务(MaaS)参考架构》标准文件正式讨论并启动编制工作,后续将持续推进成为国内模型即服务的依据标准,其中,阿里云成为这一标准编制的技术牵头方


《人工智能 模型即服务(MaaS)参考架构》标准文件中,集成了阿里云在MaaS服务实践中的大量经验。文件给出了模型即服务(MasS)的参考架构,规定了MaaS提供方、模型用户、模型及数据提供者、基础设施提供者的主要活动,以及规范了MaaS的主要功能层、功能组件以及接口等,适用于模型即服务及其应用系统的构建、应用、实施与维护。



同一会议上,阿里云作为联合技术牵头方的《人工智能 开源模型服务平台技术要求》国标提案也开展了工作组讨论,进入编制环节。该提案给出了开源模型服务平台的整体架构,适用于相关平台的规划、建设、运行和维护。


今年以来,阿里云持续在中国人工智能领域贡献我们的产业实践。阿里云在国家人工智能标准化总体组大模型专题组中担任联合组长单位,深度参与了多个大模型相关国家标准的制定。阿里云还是唯一开源自研大模型的云厂商,通义千问登顶国内外多个权威开源模型榜单。



/ END /

目录
相关文章
|
7月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
8月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
742 2
|
7月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
655 121
|
7月前
|
数据采集 人工智能 搜索推荐
智能新纪元:多模态大模型如何重塑人机交互
智能新纪元:多模态大模型如何重塑人机交互
385 113
|
7月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
467 114
|
7月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
1121 120
|
7月前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
767 117
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
1168 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

热门文章

最新文章