燃!阿里技术又破世界纪录:机器阅读理解力首次超过人类!

简介:

2018年伊始,人工智能取得重大突破!1月11日,由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD刷新排名,令业界振奋的是人工智能的阅读能力历史上首次超越人类。阿里巴巴凭借82.440的精准率打破了世界纪录,并且超越了人类82.304的成绩。

1


SQuAD的负责人Pranav Rajpurkar难掩兴奋之情。他在社交媒体上表示,2018年一个强劲的开始,第一个模型(阿里巴巴iDST团队提交的SLQA +)在精准度匹配上超越人类表现!下一个挑战:模糊匹配,人类仍然领先2.5分!

2


SQuAD比赛构建了一个大规模的机器阅读理解数据集(包含10万个问题),文章来源于500多篇维基百科文章。人工智能在阅读完数据集中的一篇短文之后,需要回答若干个基于文章内容的问题,然后与标准答案进行比对,得出精确匹配(Exact Match)和模糊匹配(F1-score)的结果。

SQuAD是行业内公认的机器阅读理解顶级赛事,吸引了包括谷歌、卡内基·梅隆大学、斯坦福大学、微软亚洲研究院、艾伦研究院、IBM、Facebook等知名企业研究机构和高校的深度参与。

此次技术的重大突破源于阿里巴巴研究团队提出的“基于分层融合注意力机制”的深度神经网络模型。该模型能够模拟人类在做阅读理解问题时的一些行为,包括结合篇章内容审题,带着问题反复阅读文章,避免阅读中遗忘而进行相关标注等。

模型可以在捕捉问题和文章中特定区域关联的同时,借助分层策略,逐步集中注意力,使答案边界清晰;另一方面,为避免过于关注细节,采用融合方式将全局信息加入注意力机制,进行适度纠正,确保关注点正确。

3


阿里巴巴自然语言处理首席科学家司罗

阿里巴巴自然语言处理首席科学家司罗表示,对于解决wiki类客观知识问答,机器已经取得非常好的结果,我们将继续向对通用内容的“能理解会思考”的终极目标迈进。今后,研发的重点在于把这项技术真正应用在广大实际场景,让机器智能普惠生活。

实事上,这项技术已经在阿里巴巴内部被广泛使用。比如,每年双11都会有大量的顾客对活动规则进行咨询。阿里小蜜团队通过使用司罗团队的技术,让机器直接对规则进行阅读,为用户提供规则解读服务,是最自然的交互方式。

再比如,顾客还会针对单个商品询问大量的基础问题,而这些问题其实在商品详情页都是有答案的。现在通过机器阅读理解技术,能够让机器对详情页中的商品描述文本进行更为智能地阅读和回答,降低服务成本的同时提高购买转化率。

原文发布时间为:2018-01-14
本文作者:了不起的
本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”微信公众号

相关文章
|
搜索推荐
ChatGPT将会成为强者的外挂?—— 提高学习能力
ChatGPT将会成为强者的外挂?—— 提高学习能力
158 0
|
机器学习/深度学习 存储 人工智能
AutoGPT star量破10万,这是首篇系统介绍自主智能体的文章(2)
AutoGPT star量破10万,这是首篇系统介绍自主智能体的文章
177 0
|
机器学习/深度学习 人工智能 PyTorch
AutoGPT star量破10万,这是首篇系统介绍自主智能体的文章(1)
AutoGPT star量破10万,这是首篇系统介绍自主智能体的文章
122 0
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
531 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
机器学习/深度学习 传感器 人工智能
AI老司机,驾龄等于人类2万年:计划两年登上百万台车
AI老司机,驾龄等于人类2万年:计划两年登上百万台车
247 0
AI老司机,驾龄等于人类2万年:计划两年登上百万台车
|
人工智能 自然语言处理 搜索推荐
增长难题如何破?20天后引擎大会或给出“答题指引”
增长难题如何破?20天后引擎大会或给出“答题指引”
239 0
增长难题如何破?20天后引擎大会或给出“答题指引”
|
架构师 定位技术 开发者
在有限的时间内解决关键的问题:百度开放云编程马拉松
Hackathon(编程马拉松)是一项让开发者们聚在一起,以团队合作的形式在特定时间内完成自己的参赛作品的活动。11月24日,由百度开放云与PingWest联合举办的百度开放云编程马拉松活动顺利结束,这次比赛共有20只团队报名参赛,从23日下午开始,经过连续30个小时的奋战后,有19只团队完成了自己的参赛作品。每组团队在对自己的作品进行Demo演示后,评委们根据创意、完成度、百度开放云相关度和商业化四个方面对每组作品进行了打分,最后有5只团队脱颖而出,分别获得了本次活动的不同奖项。
173 0
在有限的时间内解决关键的问题:百度开放云编程马拉松
|
达摩院 算法 网络协议
为了让网速更快,阿里工程师与顶级数学家有一个大胆猜想
2008年,当英国数学家Frank Kelly凭借原创性的网络理论拿下运筹优化学的“诺贝尔” -- 冯·诺依曼理论奖,可能并不会想到,11年后,他还将亲自参与“重塑”这一心血之作的全过程。
7389 0
|
机器学习/深度学习 新零售 人工智能
精准率首次超过人类!阿里巴巴机器阅读理解打破世界纪录!
2018年伊始,人工智能取得重大突破!1月11日,由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD刷新排名,令业界振奋的是人工智能的阅读能力历史上首次超越人类。阿里巴巴凭借82.440的精准率打破了世界纪录,并且超越了人类82.304的成绩。
|
算法 安全
提前官宣!李想亲自晒出理想智造ONE实拍图
今日上午,李想在微博中晒出两张理想智造ONE的实拍照片。
708 0
下一篇
无影云桌面