论文 3:Evaluating Factuality in Text Simplification
- 作者:Ashwin Devaraj、William Berkeley Sheffield、Byron C Wallace 等
- 论文地址:https://arxiv.org/pdf/2204.07562.pdf
摘要:自动简化模型旨在使输入文本更具可读性,但此类模型会在自动简化的文本中引入错误。因此,德克萨斯大学奥斯汀分校、东北大学的研究者提出了一种错误分类法,用来分析从标准简化数据集和 SOTA 模型输出中提出的参考资料。
三种类型的信息错误的示例。
手动评估的系统输出中的 SARI 和错误分布。
训练集中的注释标签计数和测试集上的 F1 分数。
推荐:ACL 2022 杰出论文之一。
论文 4:Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation
- 作者:Xiangpeng Wei、Heng Yu、Yue Hu 等
- 论文地址:https://arxiv.org/pdf/2204.06812v1.pdf
摘要:监督神经机器翻译(NMT)的主要任务是学习生成以来自一组并行句子对的源输入为条件的目标句子,从而得到一个能够泛化到未见过实例的模型。然而,通常观察到模型的泛化性能很大程度上受训练中使用的并行数据量的影响。
阿里达摩院、中科院信息工程研究所、中国科学院大学的研究者提出了一种新的数据增强范式,称之为连续语义增强(CsaNMT),它为每个训练实例增加了一个邻接语义区域。
CSANMT 框架。
算法 1:MGRC 采样。
WMT14 En→De 和 En→Fr 任务上的 BLEU 分数。
推荐:ACL 2022 杰出论文之一。
论文 5:PP-YOLOE: An evolved version of YOLO
- 作者:Shangliang Xu、Xinxin Wang、Wenyu Lv 等
- 论文地址:https://arxiv.org/abs/2203.16250
摘要:百度飞桨团队发布了 PP-YOLOE,与其他 YOLO 系列算法相比,其具有更强的性能、更丰富灵活的配置方案以及更全硬件支持三大优势。
PP-YOLOE 各尺寸模型性能与其他模型对比示意图。
PP-YOLOE 模型结构示意图。
RepResBlock 和 CSPRepResStage 结构示意图。
推荐:YOLO 界再起波澜!mAP 51.4,149FPS,目标检测,一个就够了。
论文 6:Google Scanned Objects: A High-Quality Dataset of 3D Scanned Household Items
- 作者:Laura Downs、Anthony Francis、Nate Koenig 等
- 论文地址:https://arxiv.org/pdf/2204.11918.pdf
摘要:谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描的家用物品组成的精选集,可用于 Ignition Gazebo、Bullet 模拟器和其他可以读取 SDF 模型格式的工具。
谷歌 GSO 的自定义 3D 扫描流程。
选取的 3D 模型数据集非常适合做仿真。
扫描校准过程。
推荐:谷歌公布 13GB 3D 扫描数据集:17 大类、1030 个家用物品。
论文 7:Ditch the Gold Standard: Re-evaluating Conversational Question Answering
- 作者:Huihan Li、高天宇、Manan Goenka、陈丹琦
- 论文地址:https://arxiv.org/pdf/2112.08812v2.pdf
摘要:在这项工作中,研究者对 SOTA 对话式 QA 系统进行了首次大规模的人类评估,其中人类评估员与模型进行对话,并判断其答案的正确性。该研究发现人机(human-machine)对话的分布与人 - 人(human-human )对话的分布有很大的不同,在模型排名方面,人类评估和黄金历史(gold history)评估存在分歧。
该研究进一步研究了如何改进自动评估,并提出了一种基于预测历史的问题重写机制,该机制可以与人类判断更好地关联。最后,该研究分析了各种建模策略的影响,并讨论了构建更好的对话式问答系统的未来方向。
使用 gold history 和 predicted history 的人类和自动评估示例。
使用 predicted history 的无效问题的示例。
问题重写示例。
推荐:ACL 2022 杰出论文之一。
ArXiv Weekly Radiostation
机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括NLP、CV、ML领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:
10 NLP Papers音频:00:0018:42
本周 10 篇 NLP 精选论文是:
1. Voxel-informed Language Grounding. (from Trevor Darrell)2. ACCoRD: A Multi-Document Approach to Generating Diverse Descriptions of Scientific Concepts. (from Daniel S. Weld)3. Interlock-Free Multi-Aspect Rationalization for Text Classification. (from Boi Faltings)4. Consistent Human Evaluation of Machine Translation across Language Pairs. (from Philipp Koehn)5. Directed Acyclic Transformer for Non-Autoregressive Machine Translation. (from Yang Liu, Hang Li, Minlie Huang)6. Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner. (from Dan Roth)7. LAGr: Label Aligned Graphs for Better Systematic Generalization in Semantic Parsing. (from Dzmitry Bahdanau)8. Long-term Control for Dialogue Generation: Methods and Evaluation. (from Kilian Q. Weinberger, Ryan McDonald)9. Twist Decoding: Diverse Generators Guide Each Other. (from Dragomir Radev, Noah A. Smith)10. A Simple yet Effective Relation Information Guided Approach for Few-Shot Relation Extraction. (from Yang Liu)