比拼“读懂人话”,阿里AI总分首次超越人类成绩

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: 比拼“读懂人话”,阿里AI总分首次超越人类成绩


刚刚,权威榜单CLUE公布了最新成绩

阿里AI以86.685的总分成绩创造了新纪录

这是该榜单诞生近三年以来

AI首次超越人类成绩(86.678)


CLUE最新榜单:阿里通义AliceMind总分超越人类成绩


作为业界最权威的中文自然语言理解榜单之一,CLUE从文本分类、阅读理解、自然语言推理等9项任务中全面考核AI模型的语言理解能力。


过去三年,该榜单吸引了众多国内顶尖NLP团队的参与,尽管榜首位置多次易主,但参评AI模型一直未能超越人类成绩。


根据最新的结果,此次参评的AI模型为阿里通义大模型系列的AliceMind(以下简称“阿里通义AliceMind”),在4项任务中的表现超过人类水平,同时实现了总榜平均分的首次超越,意味着AI模型的中文语言理解水平达到了新的高度。


中文语言理解是AI业界亟待攻克的难题之一。


“人工智能之父”阿兰·图灵提出的图灵测试,就把语言理解能力作为判别一个机器系统有无智能的标准,但如今的AI依旧没能掌握这一技能。因此,自然语言理解也被认为是人工智能皇冠上的明珠。


由于中文汉字比拉丁语系中的单词语义更加模糊,容易产生歧义、信息失真等问题,这给AI提出了更大的挑战。


为提升AI模型对词语、句子以及语言整体的理解力,达摩院分阶段对模型进行优化。


在预训练阶段:达摩院沿用超大规模模型训练所使用的海量高质量中文文本,同时对模型结构和训练技术进行了一系列优化:


如使用激活函数GLU、字词混合的大词表等获得更强的文本建模能力;


使用StrongHold训练加速技术缩短迭代周期、节约算力成本,进而获得性能的显著提升。


在精调阶段:面对文本分类、阅读理解、自然语言推理等下游任务,达摩院采用了迁移学习、数据增强、特征增强等技术,进一步提升模型表现。


以CLUE榜单的CHID成语阅读理解填空任务为例,该任务需要AI模型选出正确的成语进行填空。阿里通义AliceMind可通过海量文本数据的学习达到“博闻强识”的效果,在预训练阶段掌握选词填空所依赖的语义理解能力,并将其进行成语数据的领域迁移训练,最终模型在测试任务中的成绩远超人类。


作为最早投入预训练语言模型研究的团队之一,达摩院研发了阿里通义AliceMind,该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等多种能力,该模型体系已斩获36项冠军。


目前,相关技术已应用于医疗、电商、法律等领域,在跨境电商领域,达摩院的机器翻译系统能提供214种语言的互译服务,每天为国内200万中小商家翻译上亿文字,助力国货走向全世界。


阿里通义AliceMind基础模型已在ModelScope平台(魔搭平台)开放。

目录
相关文章
|
16天前
|
消息中间件 人工智能 Cloud Native
|
13天前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
15天前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
1月前
|
消息中间件 人工智能 运维
|
2月前
|
人工智能 前端开发 Java
【实操】Spring Cloud Alibaba AI,阿里AI这不得玩一下(含前后端源码)
本文介绍了如何使用 **Spring Cloud Alibaba AI** 构建基于 Spring Boot 和 uni-app 的聊天机器人应用。主要内容包括:Spring Cloud Alibaba AI 的概念与功能,使用前的准备工作(如 JDK 17+、Spring Boot 3.0+ 及通义 API-KEY),详细实操步骤(涵盖前后端开发工具、组件选择、功能分析及关键代码示例)。最终展示了如何成功实现具备基本聊天功能的 AI 应用,帮助读者快速搭建智能聊天系统并探索更多高级功能。
1000 2
【实操】Spring Cloud Alibaba AI,阿里AI这不得玩一下(含前后端源码)
|
1月前
|
人工智能 前端开发 Java
Spring Cloud Alibaba AI,阿里AI这不得玩一下
🏀闪亮主角: 大家好,我是JavaDog程序狗。今天分享Spring Cloud Alibaba AI,基于Spring AI并提供阿里云通义大模型的Java AI应用。本狗用SpringBoot+uniapp+uview2对接Spring Cloud Alibaba AI,带你打造聊天小AI。 📘故事背景: 🎁获取源码: 关注公众号“JavaDog程序狗”,发送“alibaba-ai”即可获取源码。 🎯主要目标:
51 0
|
2月前
|
机器学习/深度学习 人工智能 编解码
【机器学习】阿里Qwen-VL:基于FastAPI私有化部署你的第一个AI多模态大模型
【机器学习】阿里Qwen-VL:基于FastAPI私有化部署你的第一个AI多模态大模型
413 0
|
6天前
|
人工智能 Serverless
AI助理精准匹配------助力快速搭建Stable Difussion图像生成应用
【10月更文挑战第7天】过去在阿里云社区搭建Stable Diffusion图像生成应用需查阅在线实验室或官方文档,耗时且不便。现阿里云AI助理提供精准匹配服务,直接在首页询问AI助理即可获取详细部署步骤,简化了操作流程,提高了效率。用户可按AI助理提供的步骤快速完成应用创建、参数设置、应用部署及资源释放等操作,轻松体验Stable Diffusion图像生成功能。
|
7天前
|
传感器 机器学习/深度学习 人工智能
AI在智能制造中的革新应用与未来展望
【10月更文挑战第10天】AI在智能制造中的革新应用与未来展望
|
1天前
|
机器学习/深度学习 人工智能 算法
介绍一下AI在药物研发中的应用。
【10月更文挑战第16天】介绍一下AI在药物研发中的应用。
7 0