7 Papers & Radios | ACL 2022最佳&杰出论文;谷歌3D扫描家用物品数据集(1)

简介: 7 Papers & Radios | ACL 2022最佳&杰出论文;谷歌3D扫描家用物品数据集

本周重要论文包括:ACL 2022 最佳论文、最佳主题论文和杰出论文,以及谷歌公布的包含 17 大类、1030 个家用物品的 13GB 家用物品 3D 扫描数据集。


目录:

Learned Incremental Representations for Parsing

Requirements and Motivations of Low-Resource Speech Synthesis for Language Revitalization

Evaluating Factuality in Text Simplification

Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation

PP-YOLOE: An evolved version of YOLO

Google Scanned Objects: A High-Quality Dataset of 3D Scanned Household Items

Ditch the Gold Standard: Re-evaluating Conversational Question Answering

ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:Learned Incremental Representations for Parsing


摘要:该研究提出了一种增量句法表示,该表示包括为句子中的每个单词分配一个离散标签,其中标签是使用句子前缀的严格增量处理来预测的,并且句子标签序列完全确定了解析树。该研究旨在诱导一种句法表示,它只在句法选择由输入逐渐显示时才确定这些选择,这与标准表示形成鲜明对比,标准表示必须进行输出选择,例如推测性的附件,然后抛出相互冲突的分析。
该研究学习的表示在 Penn Treebank 上达到了 93.72 F1,且每个单词只有 5 bit;在每个单词为 8 bit 时,该研究在 Penn Treebank 上达到了 94.97 F1,这和使用相同的预训练嵌入时的 SOTA 解析模型相当。该研究还对系统学习到的表示进行了分析,他们研究了系统捕获的可解释句法特征等属性,以及句法歧义的延迟解决机制。

解析器使用不同句法表示和预训练编码器时,在 WSJ 测试集上的 F1 分数。

使用不同模型上下文时,在 WSJ 开发集上的解析性能。

将本研究的 read-out 网络应用于句法标记序列的前缀表明句法决策致力于增量,并且不是所有的都推迟到句子最后。 推荐:加州大学伯克利分校的这项增量句法表示研究被评为 ACL 2022 最佳论文。

论文 2:Requirements and Motivations of Low-Resource Speech Synthesis for Language Revitalization


摘要:该研究阐述了语音合成系统的发展动机和目的,以振兴语言。通过为加拿大使用的三种土著语言 (Kanien 'kéha, Gitksan 和 SENĆOŦEN) 构建语音合成系统,该研究重新评估了需要多少数据才能构建具有 SOTA 性能的低资源语音合成系统。例如,该研究在英语数据的初步结果表明,在训练数据上训练 1 小时的 FastSpeech2 模型可以产生与训练 10 小时的 Tacotron2 模型语音自然度相当。
最后,该研究们鼓励在语音合成领域进行评估和课堂整合来进行未来研究,以实现语言复兴。

在 LJ 语料库上训练 100k 步后提取的 Tacotron2 注意力网络权重的可视化图。

来自 MUSHRA 问题中调研数据的箱型图,比较了 Tacotron2 (TT2) 和 FastSpeech2 (FS2) 模型与有限的训练数据量。

推荐:ACL 2022 最佳主题论文。


相关文章
|
7月前
|
存储 消息中间件 缓存
聊聊并发的本质《一场对资源与时间的极致博弈》
高并发的本质是有限资源下对时间与效率的极致优化,核心在于资源调度与请求处理的平衡。通过分治、缓存、异步、无状态等策略,化解请求无限性与系统能力有限性的矛盾,实则是技术与权衡的艺术。
|
消息中间件
RabbitMQ延时队列插件rabbitmq_delayed_message_exchange-3.8.0.ez,有需要的朋友可自取
RabbitMQ延时队列插件rabbitmq_delayed_message_exchange-3.8.0.ez,有需要的朋友可自取
812 0
|
机器学习/深度学习 监控 计算机视觉
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
本文介绍了如何使用YOLOv7进行目标检测,包括环境搭建、数据集准备、模型训练、验证、测试以及常见错误的解决方法。YOLOv7以其高效性能和准确率在目标检测领域受到关注,适用于自动驾驶、安防监控等场景。文中提供了源码和论文链接,以及详细的步骤说明,适合深度学习实践者参考。
4118 1
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
人工智能 数据可视化 算法
|
弹性计算 运维 Shell
批量创建账号4
【4月更文挑战第30天】
205 1
|
存储 索引 Perl
Perl 教程 之 Perl 面向对象 3
Perl的面向对象编程涉及两种实现:匿名哈希表引用和数组引用。对象是类(Perl包)中数据项的引用,方法是接收类名或对象作首参的子程序。
190 3
|
Java 程序员 编译器
java初识
java初识
323 0
java初识
|
存储 监控 Unix
部署文件服务(一)
部署文件服务(一)
636 0
|
传感器 机器学习/深度学习 算法
【组合导航】GNSS与惯性及多传感器组合导航附matlab代码
【组合导航】GNSS与惯性及多传感器组合导航附matlab代码
|
SQL 消息中间件 存储
使用 CSP进行欺诈检测
构建实时流分析数据管道需要能够处理流中的数据。流内处理的一个关键先决条件是能够收集和移动在源点生成的数据。这就是我们所说的第一英里问题。本博客将分两部分发布。在第一部分中,我们将研究由 Apache NiFi 提供支持的Cloudera DataFlow如何通过轻松高效地获取、转换和移动数据来解决第一英里问题,以便我们可以轻松实现流分析用例。我们还将简要讨论在 Cloudera DataFlow 的云原生 Kubernetes 部署中运行此流程的优势。
使用 CSP进行欺诈检测