A Thorough Examination of CNN/Daily Mail Reading Comprehension

简介:

本篇是reading comprehension系列的第三篇,文章于2016年6月9号submit在arxiv上,比之前介绍的Gated-Attention Readers for Text Comprehension更晚地出现,但尴尬的是本文的模型结果不如GA Reader。6月7号submit的一篇Iterative Alternating Neural Attention for Machine Reading,用了和GA非常类似的方法,得到了稍微差一点的结果。确实最近在arxiv上常常可以刷出reading comprehension的paper,可以看得出这个领域当前多么地火热。同时火热的还有dialogue generation任务,今天凌晨的wwdc2016大会中,苹果宣布打造更加智能的siri,几大科技巨头纷纷表示要将聊天机器人作为智能的未来,由此可见与其相关的研究将会越来越热。本文的作者是来自斯坦福大学的博士生Danqi Chen,本科毕业于清华的姚班。

虽然本文并没有比GA模型有更好的效果,但作为了解整个Reading Comprehension研究的发展以及模型的思路还是很有意义的。本文最大的贡献在于提出了一种基于人工特征的分类器模型和一个改进版的端到端模型(这里是基于Teaching Machines to Read and Comprehend的Attentive Reader模型)。

第一个模型,是典型的人工特征模型,通过提取了八个特征构建特征空间,通过使得正确答案entity比其他entity获得更高的得分来训练得到模型参数。包含的特征有:该entity是否出现在原文中,该entity是否出现在问题中,出现过几次,第一次出现的位置等等八个特征。

第二个模型,基本思路与Attentive Reader接近。看下图:

这里只介绍不同的地方:

1、在计算query和document的注意力权重时,没有采用非线性的tanh,而是采用了bilinear。

2、得到注意力权重之后,计算context的输出,然后直接用输出进行分类预测,而Attentive Reader是用输出与query又做了一次非线性处理之后才预测的。

3、词汇表中只包括entity,而不是所有的单词。

模型上的改进只有第一点算是吧,后两点只是做了一些简单的优化。

虽然模型简单了,但效果却比Attentive Reader好很多,提升了约5%的效果,我们不管其模型有没有什么亮点,这些简化处理反而得到非常好的效果,这一点很引人深思。

结果这部分,作者分析了八个特征分别对模型结果的影响,其中影响最大的是n-gram match(entity和placeholder是否有相似的上下文),其次是entity出现的频率,具体见下表:


端到端模型比Attentive Reader效果好很多,但和最近的GA来比还是差了很多。看过本文之后,只有一个疑问,简化后的模型为什么比稍微复杂一点的模型好那么多呢?

最后作者总结了下Reading Comprehension任务中常用的数据集:

1、CNN/Daily Mail

2、MCTest

3、Children Book Test(CBT)

4、bAbI

本周末计划将本周看过的几篇reading comprehension写成一篇综述,好好做一次系统地对比和总结。敬请期待。



来源:paperweekly


原文链接

相关文章
|
自然语言处理 开发者 异构计算
社区供稿 | Llama3-8B中文版!OpenBuddy发布新一代开源中文跨语言模型
此次发布的是在3天时间内,我们对Llama3-8B模型进行首次中文跨语言训练尝试的结果:OpenBuddy-Llama3-8B-v21.1-8k。
|
9月前
|
数据管理 数据处理 数据库管理
数据管理DMS上线托管Dify免费邀测中
数据管理DMS支持托管Dify,提供从Notebook开发、数据处理、模型构建到大模型应用开发的一站式Data+AI集成解决方案。借助Dify平台,简化企业智能化落地流程,了解更多详情,请访问[官方文档](https://help.aliyun.com/zh/dms/dify-invited-test/)。
|
存储 Java 内存技术
USB-C与TYPE-C接口的区别与应用
USB-C与TYPE-C接口的区别与应用
|
安全 前端开发 Java
struts2-046 远程代码执行 (CVE-2017-5638)
struts2-046 远程代码执行 (CVE-2017-5638)
828 0
struts2-046 远程代码执行 (CVE-2017-5638)
go 启动命令行传递参数
Go语言内置的 flag 包实现了命令行参数的解析,flag 包使得开发命令行工具更为简单。
1505 0
|
小程序 开发者
微信小程序狼人杀游戏代码及步骤
微信小程序狼人杀游戏代码及步骤
633 0
|
Go 数据库 微服务
Go语言微服务框架 - 1.搭建gRPC+HTTP的双重网关服务
大家好,我是六月天天。如题所述,从今天开始,我将和大家一起逐步完成一个微服务框架。
324 1
|
前端开发 安全 中间件
漫步云网端·初识VMware虚拟云网络
前不久Gartner发布了2020年“数据中心与云网络魔力象限”,可以看到思科一如既往地领跑领导者象限;与之相对应的是常年作为挑战者的华为。而晓冬今天想要分享的VMware则是其中最有远见的数据中心和云网络厂商。
漫步云网端·初识VMware虚拟云网络
|
消息中间件 监控 中间件
阿里云中间件有哪些?这里最全面
这其实是一个比较虚的概念。广义的中间件范围很广。起沟通作用的都可以认为是中间件。甚至ODBC这样的东西你也可以认为是中间件。 而阿里云的中间件就比较多了
9596 106
|
机器学习/深度学习 人工智能 安全
量子计算机给人类带来的影响
量子计算机给人类带来的影响