首批!通义千问通过国家大模型标准评测

简介: 首批!通义千问通过国家大模型标准评测


今天,在刚刚结束的全国信息技术标准化技术委员会人工智能分委会全体会议上,多个好消息传来!


国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。


同时,MaaS模型服务相关标准正式启动编制,作为首个在业界提出MaaS理念的企业,阿里云将以技术牵头方的身份持续贡献我们的想法和实践经验



01

基础大模型通义千问,首批通过国家大模型标准符合性评测


“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。



本次通过评测的首批大模型中,通义千问是唯一的开源模型,在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜,此后又登上国内上海人工智能实验室OpenCompass榜首,成为业界公认的性能最强开源大模型。


目前,通义千问APP可在苹果和安卓各大应用商店中下载体验,提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。


02

持续推进模型服务,作为技术牵头方启动MaaS相关标准编制


去年10月,阿里云在业界首次提出模型即服务MaaS理念,并发布AI模型社区“魔搭”。一年多后,市场对模型服务需求高涨,MaaS已成为全球云厂商升级部署的重要技术方向, 同时“魔搭”成为中国规模最大、最活跃的模型社区,开发者数突破280万,模型下载量破亿。


为推动MaaS领域的标准化工作,促进产业发展,在刚结束的全国信标委人工智能分委会全体会议上,《人工智能 模型即服务(MaaS)参考架构》标准文件正式讨论并启动编制工作,后续将持续推进成为国内模型即服务的依据标准,其中,阿里云成为这一标准编制的技术牵头方


《人工智能 模型即服务(MaaS)参考架构》标准文件中,集成了阿里云在MaaS服务实践中的大量经验。文件给出了模型即服务(MasS)的参考架构,规定了MaaS提供方、模型用户、模型及数据提供者、基础设施提供者的主要活动,以及规范了MaaS的主要功能层、功能组件以及接口等,适用于模型即服务及其应用系统的构建、应用、实施与维护。



同一会议上,阿里云作为联合技术牵头方的《人工智能 开源模型服务平台技术要求》国标提案也开展了工作组讨论,进入编制环节。该提案给出了开源模型服务平台的整体架构,适用于相关平台的规划、建设、运行和维护。


今年以来,阿里云持续在中国人工智能领域贡献我们的产业实践。阿里云在国家人工智能标准化总体组大模型专题组中担任联合组长单位,深度参与了多个大模型相关国家标准的制定。阿里云还是唯一开源自研大模型的云厂商,通义千问登顶国内外多个权威开源模型榜单。



/ END /

目录
相关文章
|
14天前
|
人工智能 开发者
通义千问三款主力模型再降价,最高降幅85%
通义千问三款主力模型再降价,最高降幅85%
通义千问三款主力模型再降价,最高降幅85%
|
13天前
|
人工智能 自动驾驶 云栖大会
大模型赋能智能座舱,NVIDIA 深度适配通义千问大模型
9月20日杭州云栖大会上, NVIDIA DRIVE Orin系统级芯片实现了与阿里云通义千问多模态大模型Qwen2-VL的深度适配。阿里云、斑马智行联合NVIDIA英伟达推出舱驾融合大模型解决方案,基于通义大模型开发“能听会看”的智能座舱助理,让车内人员通过语音交流就能操作座舱内的各类应用,享受极致丰富的交互体验。
|
14天前
|
API 云栖大会
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o
|
3月前
|
JSON API 定位技术
AppFlow:让通义千问大模型调用你的任意API
在阿里云AppFlow中,通过自定义插件连接器可使通义千问获取特定功能,如旅游规划或投资辅助。登录AppFlow控制台,选择“自定义连接器”,上传图标,设定基本信息,选“插件连接器”。支持Basic、Bearer Token、AppCode等鉴权。精确配置API名称、描述及请求参数,确保模型调用准确。参考示例curl命令调整参数结构,填写响应体帮助模型解析。发布后,在模型Agent搭建中选用自定义连接器增强功能。
|
4月前
|
机器学习/深度学习 算法 开发工具
通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践
阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen2模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen2系列模型的微调、评测和快速部署。
|
3月前
|
人工智能
|
4月前
|
自然语言处理 Java 测试技术
使用PostMan请求阿里云通义千问大模型
本文介绍如果通过postman调用阿里云通义千问API,然后介绍如果使用多语言集成,最后介绍了快速使用postman压测创建的API请求。
806 2
|
5月前
|
人工智能
通义千问大模型价格直线下调,优惠升级!更有新用户限时免费领取3600万额度!
通义大模型全线9款直降,最高达97%,阿里云MaaS(模型即服务)让推理成本大幅降低,加速AI应用爆发。 即刻登录阿里云百炼官网https://bailian.aliyun.com调用体验,新用户免费限时赠送3600万tokens!
如何快速体验通义千问全系列模型能力
体验通义千问全系列模型能力,需在阿里云开通百炼服务。访问阿里云百炼控制台的“模型广场”,可选择包括通义系列在内的多种模型。按照指南进行训练、部署和评测。详情参阅官方文档。
|
5月前
|
自然语言处理 搜索推荐 机器人
阿里巴巴的通义千问大模型
阿里巴巴通义千问是基于Transformer的大型语言模型,预训练于多样化数据集,支持18亿至720亿参数规模。在多模态英文任务中表现出色,且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互,提供智能体验。然而,模型在逻辑题和指令理解上存在不足,需在特定领域进行优化。
1087 1
下一篇
无影云桌面