CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理
Subjects: cs.CV
1.Efficient Teacher: Semi-Supervised Object Detection for YOLOv5
标题:高效教师:YOLOv5 的半监督目标检测
作者:Bowen Xu, Mingtao Chen, Wenlong Guan, Lulu Hu
文章链接:https://arxiv.org/abs/2302.07577v1
项目代码:https://github.com/BowieHsu/EfficientTeacher
摘要:
半监督目标检测 (SSOD) 已成功提高 R-CNN 系列和无锚检测器的性能。然而,one-stage anchor-based detectors 缺乏生成高质量或灵活伪标签的结构,导致 SSOD 中存在严重的不一致问题,例如 YOLOv5。在本文中,我们提出了高效教师框架,用于可扩展且有效的基于锚点的单阶段 SSOD 训练,由密集检测器、伪标签分配器和时代适配器组成。Dense Detector 是一种基线模型,它使用受 YOLOv5 启发的密集采样技术扩展 RetinaNet。Efficient Teacher 框架引入了一种新的伪标签分配机制,名为 Pseudo Label Assigner,它更精细地使用了 Dense Detector 中的伪标签。Epoch Adapter 是一种为 Dense Detector 提供稳定高效的端到端半监督训练计划的方法。Pseudo Label Assigner防止师生互学习机制中大量低质量的伪标签干扰Dense Detector造成的偏差,Epoch Adapter利用域和分布自适应让Dense Detector学习全局分布的一致特征,使训练独立于标记数据的比例。我们的实验表明,Efficient Teacher 框架使用比以前的方法更少的 FLOPs 在 VOC、COCO-standard 和 COCO-additional 上取得了最先进的结果。据我们所知,这是首次尝试将半监督目标检测应用于 YOLOv5。
Subjects: cs.AI、cs.AR、cs.LG
2.SCONNA: A Stochastic Computing Based Optical Accelerator for Ultra-Fast, Energy-Efficient Inference of Integer-Quantized CNNs
标题:SCONNA:一种基于随机计算的用于整数量化 CNN 的光加速器超快速、节能推理
作者:Sairam Sri Vatsavai, Venkata Sai Praneeth Karempudi, Ishan Thakkar, Ahmad Salehi, Todd Hastings
文章链接:https://arxiv.org/abs/2302.07036v1
项目代码:https://github.com/uky-ucat/sc_onn_sim
摘要:
CNN 推理任务的加速使用通常转换为向量点积 (VDP) 运算的卷积运算。已经提出了几种基于光子微环谐振器 (MRR) 的硬件架构来加速整数量化 CNN,与电子同类产品相比具有显着更高的吞吐量和能效。然而,现有的基于 MRR 的光子模拟加速器在可实现的输入/权重精度和 VDP 运算大小之间表现出非常强烈的权衡,这严重限制了它们可实现的 4 位及更高量化输入/权重精度的 VDP 运算大小。受限的 VDP 操作大小最终会抑制计算吞吐量,从而严重削弱可实现的性能优势。为了解决这个缺点,我们首次提出了随机计算和基于 MRR 的 CNN 加速器的合并。为了利用随机计算固有的精度灵活性,我们发明了一种基于 MRR 的光学随机乘法器 (OSM)。我们使用密集波分复用以级联方式使用多个 OSM,打造一种新颖的基于随机计算的光神经网络加速器 (SCONNA)。SCONNA 实现了显着的高吞吐量和能效,以加速高精度量化 CNN 的推理。我们以 8 位输入/权重精度对四个现代 CNN 的推理进行的评估表明,SCONNA 在每秒帧数 (FPS)、FPS/W 和 FPS/W/ 方面提供了高达 66.5 倍、90 倍和 91 倍的改进。mm2,分别超过之前工作的两个基于光子 MRR 的模拟 CNN 加速器,大型 CNN 的 Top-1 精度下降仅为 0.4%,小型 CNN 的 Top-1 精度下降高达 1.5%。我们开发了一个事务级、事件驱动的基于 Python 的模拟器,用于评估 SCONNA 和其他加速器
Subjects: cs.AI、cs.MA、cs.LG
3.TiZero: Mastering Multi-Agent Football with Curriculum Learning and Self-Play
标题:TiZero:通过课程学习和自我对弈掌握多智能体足球
作者:Fanqi Lin, Shiyu Huang, Tim Pearce, Wenze Chen, Wei-Wei Tu
文章链接:https://arxiv.org/abs/2302.07515v1
项目代码:https://github.com/TARTRL/TiZero
摘要:
多智能体足球对 AI 研究提出了未解决的挑战。现有工作的重点是解决游戏的简化场景,或者利用专家演示。在本文中,我们开发了一个多代理系统来玩完整的 11 对 11 游戏模式,没有演示。这种游戏模式包含对现代强化学习算法提出重大挑战的方面;多代理协调、长期规划和非传递性。为了应对这些挑战,我们推出了 TiZero;一个从头开始学习的自我进化的多代理系统。TiZero 引入了多项创新,包括自适应课程学习、新颖的自我对弈策略以及联合优化多个智能体策略的目标。实验上,它在 Google Research Football 环境中的表现大大优于之前的系统,将胜率提高了 30% 以上。为了展示 TiZero 创新的普遍性,他们在足球以外的几个环境中进行了评估;过度烹饪、多代理粒子环境、井字棋和四连棋。