又一项目击败人类,阿里巴巴的AI模型阅读理解精准率超越人类

简介:

这项技术的突破在于最新的“基于分层融合注意力机制“的深度神经网络算法。

近日,在由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD中,阿里巴巴凭借82.440的精准率,超越了人类82.304的成绩。

据了解,SQuAD比赛构建了一个大规模机器阅读理解数据集,其中包含10万个问题,文章来源于500多篇维基百科文章。比赛旨在通过梳理出这套试题的线索,看机器学习模型是否能够经过大量信息处理后给出问题的确切答案。

又一项目击败人类,阿里巴巴的AI模型阅读理解精准率超越人类

阿里巴巴研究院自然语言处理首席科学家司罗在一份公告中说,对于像“天为什么会下雨”这样的客观问题,机器给出的答案准确率会很高。这种语音技术可以逐步应用于诸如客服、博物馆指南、在线解答患者医疗问题等广泛的实际应用领域,从而以一种前所未有的方式减少人力投入的需求。

这项技术的突破在于最新的“基于分层融合注意力机制“的深度神经网络算法。该模型能够模拟人类在阅读理解问题的一些行为,包括结合篇章内容主体,带着问题反复阅读文章、避免阅读中遗忘而进行相关标注等。

同时,此项技术已被阿里内部广泛使用。例如,每年双11都有大量的顾客对活动规则进行咨询。阿里会让机器直接对规则进行阅读,为用户提供规则解读服务,完成人机自然交互。

在此次比赛中,微软程序拿到了82.6分,其他的AI程序虽然没有超过人类标准,但是得分也比较高。例如,艾伦人工智能研究所、腾讯等企业开发的AI。


原文发布时间: 2018-01-16 11:52
本文作者: Lotusun
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
1月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
|
2月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
672 109
|
3月前
|
人工智能 自然语言处理 搜索推荐
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
|
2月前
|
机器学习/深度学习 数据采集 人工智能
PyTorch学习实战:AI从数学基础到模型优化全流程精解
本文系统讲解人工智能、机器学习与深度学习的层级关系,涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程,结合数学原理与代码实践,深入浅出地介绍激活函数、反向传播等核心概念,助力快速入门深度学习。
193 1
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1417 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
1月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
263 120
|
3月前
|
机器学习/深度学习 人工智能 监控
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
大型动作模型(LAMs)作为人工智能新架构,融合神经网络与符号逻辑,实现企业重复任务的自动化处理。通过神经符号集成、动作执行管道、模式学习、任务分解等核心技术,系统可高效解析用户意图并执行复杂操作,显著提升企业运营效率并降低人工成本。其自适应学习能力与上下文感知机制,使自动化流程更智能、灵活,为企业数字化转型提供坚实支撑。
318 0
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
|
3月前
|
人工智能 JavaScript 测试技术
Cradle:颠覆AI Agent 操作本地软件,AI驱动的通用计算机控制框架,如何让基础模型像人一样操作你的电脑?
Cradle 是由 BAAI‑Agents 团队开源的通用计算机控制(GCC)多模态 AI Agent 框架,具备视觉输入、键鼠操作输出、自主学习与反思能力,可操作各类本地软件及游戏,实现任务自动化与复杂逻辑执行。
384 6

热门文章

最新文章