一周AI最火论文 | 使用图形界面就能搭建的强化学习模型-阿里云开发者社区

一周AI最火论文 | 使用图形界面就能搭建的强化学习模型

2021-10-25 223

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 一周AI最火论文 | 使用图形界面就能搭建的强化学习模型

本周关键词：自动驾驶、强化学习、GANs

本周最佳学术研究

Waymo开放数据集挑战赛

今年3月，Alphabet旗下的自动驾驶公司Waymo发起公开挑战赛，参赛者可以使用其自动驾驶数据集（包括2D和3D检测、2D和3D跟踪以及域适应数据）来建立和测试机器学习模型。挑战赛收到来自世界各地的上百份代码提交，最终入围决赛的选手来自中国、英国、新加坡、美国等多个国家。

最近公开的Waymo开放数据集（Waymo Open Dataset，WOD）是用于自动驾驶研究的大型数据集，提供了1000个用于训练和验证以及150个用于测试的驾驶片段。每个片段包含拍摄自不同摄像机的镜头，平均每部摄像机约200帧图像，这其中还包括5台分辨率为1280×1920或886×1920的高分辨率摄像机。总而言之，该数据集包含约115万张关于车辆、行人和骑自行车的人的图像，以及990万张2D边界框。

本论文给出了Waymo开放数据集（WOD）2020挑战赛的最佳解决方案。作者采用FPN（Feature pyramid networks）作为基本框架，而级联RCNN、堆叠PAFPN（Path aggregation FPN）和多头RCNN则用于提高性能。为了处理WOD中的小目标检测问题，训练和测试都使用了超大尺寸的图像，本文的方案在2D对象检测跟踪中排名第一。作者们计划持续增加数据集，希望这将有助于国际研究界在机器感知和自动驾驶技术方面取得进步。

原文：
https://arxiv.org/abs/2008.01365v1

MusPy - 用于生成符号音乐的工具包

本文介绍了MusPy，一个用于生成符号音乐的开源Python库。MusPy为音乐生成系统中的基本组件提供了易于使用的工具，包括数据集管理，数据I / O，数据预处理和模型评估等。

为了展示模型能力，作者对MusPy当前支持的11个数据集进行了统计分析。此外，他们还进行了跨数据集的泛化实验，通过在每个数据集上训练自回归模型，测量其他数据集上的留存可能性（MusPy的数据集管理系统使此过程变得更加容易）。

源码及文档：
https://github.com/salu133445/muspy
原文：
https://arxiv.org/abs/2008.01951v1

深度轻量级Transformer模型

在本论文中，Facebook人工智能实验室和艾伦人工智能研究所的研究人员提出了一种名为DeLighT的极深度轻量级Transformer模型。他们认为，与其他基于Transformer的模型相比，DeLighT可以提供类似或更好的性能，并且参数要少得多。

DeLighT可以高效地分配参数，它使用DExTra（一种深度轻量级转换）在每个Transformer编码器层中分配参数，而在各层之间使用逐层缩放的方法，这种方法允许在输入附近使用较浅较窄的DeLighT层，在输出附近使用较宽较深的DeLighT层。

总体而言，DeLighT网络的深度可以是标准Transformer模型的2.5至4倍，但参数和操作却少得多。在机器翻译和语言建模任务上进行的实验表明，DeLighT可以用更少的参数达到Transformer基线模型的性能。

源码：
https://github.com/sacmehta/delight
原文：
https://arxiv.org/abs/2008.00623v1

一个新型、简单并且可扩展性高的强化学习框架

强化学习（RL）已成为当下主流之一的研究领域，前沿的人工智能公司都会将其作为重要工具来对待。因此，许多研究人员建立了RL框架，例如openAI Gym和KerasRL，以简化其他人的使用。