阿里 AI 新记录!登顶机器阅读理解大赛冠军

简介: 阿里 AI 创造了阅读理解能力测试的新纪录。

近日,在 MS MARCO 文本阅读理解挑战赛中,阿里 AI 创造了阅读理解能力测试的新纪录,并在开放域问答任务上超越人类阅读水平。

相关论文(英文原文)下载:
https://102.alibaba.com/downloadFile.do?file=1562069368386/A%20Deep%20Cascade%20Model%20for%20Multi-Document%20Reading%20Comprehension.pdf

MS MARCO 挑战赛是 AI 阅读理解领域的权威比赛,包含100多万问题和近千万篇文档,参赛机构提供的 AI 模型需要从这些文档中找出100万个问题的正确答案。测试结果显示,阿里 AI 模型在文档检索排序和开放域自动问答两项任务都登顶榜首,其中在开放自动问答领域上超越人类水平,这意味着人工智能的阅读理解能力达到新的高度。这次评比也吸引了众多国际著名研究机构如微软、百度、FACEBOOK等参加。

2019070201.jpg
2019070202.jpg

与斯坦福大学发起的 SQuAD 挑战赛不同,MS MARCO 数据集模拟了搜索引擎中的真实应用场景,其难度更大,是机器阅读理解领域最有应用价值的数据集之一。MS MARCO 挑战赛需要参赛者提交的模型具备理解长文档多段落,并回答复杂问题的能力。对于每一个问题,MS MARCO 提供多篇来自搜索结果的网页文档,AI 需要通过阅读这些文档来回答用户提出的问题。但是,文档中是否含有答案,以及答案具体在哪一篇文档或段落中,都需 AI 自己来判断解决。

更难的是,有一部分问题无法在文档中直接找到答案,需要 AI 自由发挥做出判断。这对机器阅读理解提出了更高的要求,需要 AI 具备综合理解多文档信息、聚合生成问题答案的能力。

但阿里 AI 正在往人类思维模式接近。阿里巴巴的突破在于提出了基于“融合结构化信息 BERT 模型”的“深度级联机器阅读模型”,可以模仿人类阅读理解的过程,先对文档进行快速浏览,判断,然后针对相应段落进行精读,并根据“自己的理解”回答问题。其中,阿里巴巴自研的算法成果——“深度级联机器阅读模型”已被人工智能顶级学术会议 AAAI 2019收录。

阿里 AI 可以像人类一样在阅读并理解后快速应对天马行空的问题。比如阿里 AI 可以在毫秒内读完2亿字的巨著,相当于 5 本《大英百科全书》,并根据自己的理解快速回答100多万个不同领域的不同问题。例如2014年足球世界杯的冠军是谁?哈利波特在哪里上学的?什么是宇宙中最强的磁场?阿里 AI 可以分别迅速给出答案,无惧“连环追击”,这一研究水平可以应对高中英语阅读理解试题。

对人类而言,阅读是获取知识、不断进步的重要途径;对机器而言,同样如此。阿里AI 这一成果揭示了机器在理解大量复杂材料以及回答现实生活中复杂问题方面的潜力。这一技术已经应用在阿里巴巴的电子商务平台。例如,去年在 Lazada 一次线上促销活动前,阿里 AI 仅仅花了 30 毫秒就学会了25 个在印尼促销品销售中的所有规则,并成功应用到聊天机器人中,在活动中回答问题方面的准确率达到了 96%。

阿里巴巴达摩院语言实验室 (NLP) 团队致力与学术界、工业界同仁一起创新自然语言技术, 让商业没有语言障碍。团队二十余次在国际自然语言技术竞赛中取得冠军成绩:如2016年 CIKM Cup 电商搜索,2017年 IJCNLP 语法纠错,2017年美国标准计量局英文实体识别,2018年机器阅读理解首次超出人类回答精准率,2018年国际翻译大赛5项第一等。团队在杭州,北京,西雅图,硅谷和新加坡都在广泛招聘人才。

相关文章
|
2月前
|
消息中间件 人工智能 Cloud Native
|
2月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
2月前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
3月前
|
人工智能 前端开发 Java
Spring Cloud Alibaba AI,阿里AI这不得玩一下
🏀闪亮主角: 大家好,我是JavaDog程序狗。今天分享Spring Cloud Alibaba AI,基于Spring AI并提供阿里云通义大模型的Java AI应用。本狗用SpringBoot+uniapp+uview2对接Spring Cloud Alibaba AI,带你打造聊天小AI。 📘故事背景: 🎁获取源码: 关注公众号“JavaDog程序狗”,发送“alibaba-ai”即可获取源码。 🎯主要目标:
100 0
|
3月前
|
消息中间件 人工智能 运维
|
7天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗诊断中的应用及前景展望
本文旨在探讨人工智能(AI)技术在医疗诊断领域的应用现状、挑战与未来发展趋势。通过分析AI技术如何助力提高诊断准确率、缩短诊断时间以及降低医疗成本,揭示了其在现代医疗体系中的重要价值。同时,文章也指出了当前AI医疗面临的数据隐私、算法透明度等挑战,并对未来的发展方向进行了展望。
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
19天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
40 1
|
11天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用
【10月更文挑战第42天】本文将探讨人工智能(AI)在医疗诊断中的应用,包括其优势、挑战和未来发展方向。我们将通过实例来说明AI如何改变医疗行业,提高诊断的准确性和效率。
|
12天前
|
存储 人工智能 搜索推荐
Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库
Memoripy 是一个 Python 库,用于管理 AI 应用中的上下文感知记忆,支持短期和长期存储,兼容 OpenAI 和 Ollama API。
53 6
Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库