每日学术速递2.23

简介: 本文探讨了动态系统中的离散形态对称性,这是生物学和机器人系统的主要特征。当系统的形态具有一个或多个对称平面时,它表现出形态对称性,描述了身体部位的重复和平衡分布。这些形态对称性意味着系统的动力学是对称的(或近似对称的),这进而在最优控制策略和所有与系统动态演化相关的本体感知和外感知测量中印记了对称性。

Subjects: Robotics


1.On discrete symmetries of robotics systems: A group-theoretic and data-driven analysis


aa9173eea39018c9cbb1dcd1aa0444f6.png


标题:关于机器人系统的离散对称性:群论和数据驱动分析

作者:Daniel Ordonez-Apraez, Mario Martin, Antonio Agudo, Francesc Moreno-Noguer

文章链接:https://arxiv.org/abs/2302.10433v1

项目代码:https://github.com/danfoa/robotequivariantnn

e7ba63fddfd7056fe9608da3ef1c0fd4.png

60466952f95b744d0927eec4088ec734.png

摘要:

       本文探讨了动态系统中的离散形态对称性,这是生物学和机器人系统的主要特征。当系统的形态具有一个或多个对称平面时,它表现出形态对称性,描述了身体部位的重复和平衡分布。这些形态对称性意味着系统的动力学是对称的(或近似对称的),这进而在最优控制策略和所有与系统动态演化相关的本体感知和外感知测量中印记了对称性。对于数据驱动的方法,对称性表示归纳偏差,有助于数据增强和构建对称函数逼近器。本文利用群论提出了一个理论和实践框架,允许(1)识别系统的形态对称群G,(2)本体感知和外感知测量的数据增强,以及(3)通过使用G等变/不变神经网络利用数据对称性,针对合成和真实世界应用提出了实验结果,展示了对称性约束如何提高样本效率和泛化能力,同时减少可训练参数的数量。

Subjects: cs.CV


2.BrackishMOT: The Brackish Multi-Object Tracking Dataset

db8d478a37052a186c1a0b0ebe0a665d.png

标题:BrackishMOT:咸水多目标跟踪数据集

作者:Malte Pedersen, Daniel Lehotský, Ivan Nikolov, Thomas B. Moeslund

文章链接:https://arxiv.org/abs/2302.10645v1

项目代码:https://github.com/daniellehot/Underwater-Fish-Environment

29c0785f4d68e9f13ba3b344d419f2f9.png

e60aea777c6ce8bf658ca84702d4ae0c.png

摘要:

       不存在在浑浊环境中捕获的公开可用的带注释的水下多目标跟踪 (MOT) 数据集。为了解决这个问题,我们提出了 BrackishMOT 数据集,重点是跟踪小鱼群,这是众所周知的困难 MOT 任务。BrackishMOT 由 98 个在野外捕获的序列组成。除了新颖的数据集,我们还通过训练最先进的跟踪器来呈现基线结果。此外,我们提出了一个用于创建合成序列的框架以扩展数据集。该框架由动画鱼模型和逼真的水下环境组成。我们分析了在训练过程中包含合成数据的效果,并表明真实和合成水下训练数据的结合可以提高跟踪性能。

Subjects: cs.RL


3.Minimax-Bayes Reinforcement Learning

b7a9649b6d1881c87db1c8d2e7b262c8.png


标题:Minimax-Bayes 强化学习

作者:Thomas Kleine Buening, Christos Dimitrakakis, Hannes Eriksson, Divya Grover, Emilio Jorge

文章链接:https://arxiv.org/abs/2302.10831v1

项目代码:https://github.com/minimaxbrl/minimax-bayes-rl

08220c463fbf9d34cb7fb35cf0b0d2a0.png

def17b60ab0608348488705b2366a8a2.png

摘要:

       虽然贝叶斯决策理论框架为不确定性下的决策问题提供了一种优雅的解决方案,但一个问题是如何适当地选择先验分布。一个想法是采用最坏情况先验。然而,这在顺序决策制定中不像在简单的统计估计问题中那样容易指定。本文针对各种强化学习问题研究(有时是近似的)minimax-Bayes 解决方案,以深入了解相应先验和策略的属性。我们发现,虽然最坏情况先验取决于设置,但相应的极小极大策略比假设标准(即统一)先验的策略更稳健。

目录
相关文章
|
机器学习/深度学习 存储 自然语言处理
每日学术速递5.3
用任意语音音频生成说话人肖像是数字人和虚拟世界领域的一个关键问题。一种现代的说话人脸生成方法有望实现通用的音频-嘴唇同步、良好的视频质量和高系统效率的目标。
194 0
|
机器学习/深度学习 自然语言处理 物联网
每日学术速递5.1
大型语言模型 (LLM) 在各种开放式任务中展示了令人印象深刻的零样本能力,而最近的研究还探索了使用 LLM 进行多模态生成。
134 0
|
传感器 机器学习/深度学习 人工智能
每日学术速递5.12
用户可以付费查询的大型语言模型 (LLM) 数量迅速增加。我们审查了与查询流行的 LLM API 相关的成本,例如GPT-4、ChatGPT、J1-Jumbo,并发现这些模型具有异构的定价结构,费用可能相差两个数量级。特别是,在大量查询和文本上使用 LLM 可能会很昂贵。
115 0
|
机器学习/深度学习 自然语言处理 物联网
每日学术速递4.6
大型语言模型 (LLM)(如 GPT-3 和 ChatGPT)的成功导致开发了许多具有成本效益且易于访问的替代方案,这些替代方案是通过使用特定于任务的数据(例如,ChatDoctor)微调开放访问 LLM 创建的) 或指令数据(例如,Alpaca)。在各种微调方法中,基于适配器的参数高效微调(PEFT)无疑是最吸引人的话题之一
141 0
|
机器学习/深度学习 自然语言处理 PyTorch
每日学术速递2.17
近年来,大型深度学习 (DL) 模型的开发有所增加,这使得训练效率变得至关重要。通常的做法是在可用性和性能之间进行权衡。一方面,诸如 PyTorch 之类的 DL 框架使用动态图来以次优模型训练性能为代价为模型开发人员提供便利。
89 0
|
机器学习/深度学习 人工智能 自然语言处理
每日学术速递4.21
大型语言模型(LLM)在各种具有涌现能力的自然语言处理任务中取得了显着进步。然而,他们面临着固有的局限性,例如无法访问最新信息、无法使用外部工具或进行精确的数学推理。在本文中,我们介绍了 Chameleon,这是一种即插即用的组合推理框架,可增强 LLM 以帮助应对这些挑战。
147 0
|
机器学习/深度学习 自然语言处理 算法
每日学术速递3.8
扩散模型(DM)已成为生成模型的新趋势,并展示了强大的条件合成能力。其中,在大规模图像文本对上预训练的文本到图像扩散模型可通过可定制的提示高度控制。与专注于低级属性和细节的无条件生成模型不同,由于视觉语言预训练,文本到图像扩散模型包含更多高级知识。在本文中,我们提出了 VPD(具有预训练扩散模型的视觉感知),这是一种在视觉感知任务中利用预训练文本到图像扩散模型的语义信息的新框架。我们没有在基于扩散的管道中使用预训练的去噪自动编码器,而是简单地将其用作主干,旨在研究如何充分利用所学知识。
112 0
|
机器学习/深度学习 自然语言处理 算法
每日学术速递4.14
我们提出了 ImageReward——第一个通用的文本到图像人类偏好奖励模型——来解决生成模型中的各种普遍问题,并使它们与人类价值观和偏好保持一致。它的训练基于我们的系统注释管道,涵盖评级和排名组件,收集了迄今为止 137k 专家比较的数据集。
140 0
|
机器学习/深度学习 存储 自然语言处理
每日学术速递5.2
现有的深度视频模型受限于特定任务、固定的输入输出空间和较差的泛化能力,难以在真实场景中部署。在本文中,我们提出了我们对多模态和多功能视频理解的愿景,并提出了一个原型系统 \system
140 0
|
机器学习/深度学习 自然语言处理 自动驾驶
每日学术速递5.9
目标跟踪的大多数先前进展是在具有良好照明的白天场景中实现的。迄今为止,最先进的技术很难在夜间发挥其优势,从而大大阻碍了与视觉跟踪相关的无人机 (UAV) 应用的扩展
145 0