7 Papers & Radios | SIGGRAPH 2022最佳博士论文;DeepMind AI西洋陆军棋中对人胜率84%

简介: 7 Papers & Radios | SIGGRAPH 2022最佳博士论文;DeepMind AI西洋陆军棋中对人胜率84%
本周重要论文包括 ACM SIGGRAPH 2022 最佳博士论文及五篇最佳论文。


目录:

  1. Acquiring Motor Skills Through Motion Imitation and Reinforcement Learning
  2. Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency
  3. Translating Images into Maps
  4. CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking
  5. FedTree: A Fast, Effective, and Secure Tree-based Federated Learning System
  6. Quantum Tunneling Based Ultra-Compact and Energy Efficient Spiking Neuron Enables Hardware SNN
  7. Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning
  8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:Acquiring Motor Skills Through Motion Imitation and Reinforcement Learning


摘要:作者提出了动作模仿技术,使智能体能够通过模仿演示学习大量高度动态和运动行为。智能体无需为每个感兴趣的技能设计控制器或奖励函数,只需接受预期技能所需要的一些运动示例片段即可。这样一来,作者提出的框架就可以合成一个紧密复刻目标行为的控制器。

在过程中,作者首先提出一个动作模仿框架,使模拟智能体能够模仿参考动作片段中的复杂行为,包括步行和奔跑等常见的运动技能以及杂技和武术等更复杂的运动行为。智能体学习产生稳健和栩栩如生的行为,它们在外观上与现实中演员做出的动作几乎难以区分。

最后,作者又开发了相关模型,它们能够重复使用并组合从动作模仿中学得的技能,以解决具有挑战性的下游任务。除了为模拟智能体开发控制器外,作者的方法还可以为现实世界运行的机器人合成控制器。他通过为双足和四足机器人的各种敏捷运动技能开发控制器,证明了自己方法的有效性。


推荐:ACM SIGGRAPH 2022 最佳博士论文。

论文 2:Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency


摘要:该研究提出了一个受神经学启发的感知模型来预测人眼反应延迟期,作为在屏幕上被观察图像特征的函数。该模型可以作为预测和改变电子竞技与 AR/VR 应用中反应延迟的指标。

(a)电竞目标搜索中的眼跳反应;(b)模型在目标候选者上的预测。

推荐:ACM SIGGRAPH 2022 最佳论文之一。

论文 3:Translating Images into Maps


摘要:来自萨里大学的研究者引入了注意力机制,将自动驾驶的 2D 图像转换为鸟瞰图,使得模型的识别准确率提升了 15%。这项研究在不久前落幕的 ICRA 2022 会议上获得了杰出论文奖

与以往的方法不同,这项研究将 BEV 的转换视为一个「Image-to-World」的转换问题,其目标是学习图像中的垂直扫描线和 BEV 中的极射线(polar ray)之间的对齐。在对齐模型上,研究者采用了 Transformer 这种基于注意力的序列预测结构。研究者将基于 Transformer 的对齐模型嵌入一个端到端学习公式中,该公式以单目图像及其固有矩阵为输入,然后预测静态和动态类的语义 BEV 映射。

模型架构。

推荐:ICRA 2022 杰出论文:把自动驾驶 2D 图像转成鸟瞰图,模型识别准确率立增 15%。

论文 4:CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking


摘要:本文介绍一个刚刚发表在 NAACL 上的中文的事实核查数据集 CHEF(受 HotpotQA 启发,是不是可以搞一个吃饭数据集宇宙 XD),论文作者来自清华,剑桥和 UIC 的 Philip Yu 组。据我们所知,这是第一个基于证据的中文事实核查数据集

目前事实核查的数据集大致可以分为两类:人工的(Artificial)和天然的 (Natural)。

推荐:第一个基于证据的中文事实核查数据集。

论文 5:FedTree: A Fast, Effective, and Secure Tree-based Federated Learning System

摘要:近日,来自新加坡国立大学和清华大学的研究者提出了一种专注于训练树模型的联邦学习新系统 FedTree。FedTree 的架构共有 5 个模块:接口、环境、框架、隐私保护以及模型

FedTree 系统架构图。

推荐:专为决策树打造,新加坡国立大学 & 清华大学联合提出快速安全的联邦学习新系统。

论文 6:Quantum Tunneling Based Ultra-Compact and Energy Efficient Spiking Neuron Enables Hardware SNN


摘要:在最近的一项研究中,来自孟买理工学院的研究者实现了超低功耗人工神经元,允许 SNN 排列更紧凑。他们创造了一种 SNN,这种 SNN 依赖于一种新的、紧凑的电流源来为电容器充电,被称为 BTBT( band-to-band-tunneling current)

在 BTBT 中,量子隧穿电流以极低的电流使电容器充电,这意味着所需的能量更少。BTBT 方法还省去了用较大电容来存储大量的电流,为芯片上更小的电容铺平了道路,从而节省了空间。研究人员使用 45 纳米商用绝缘硅片晶体管技术对 BTBT 神经元方法进行测试,结果显示这种方法节省了大量的能源和空间。他们还宣布了一种新的低功耗 AI 芯片,它可以实现所谓的脉冲神经网络

孟买理工学院研究者,包括 Maryam Shojaei Baghini(左一) 和 Udayan Ganguly(右一) 教授。

推荐:超低功耗 AI 芯片:神经脉冲只需同类神经网络能量的 0.02%。

论文 7:Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

摘要:近日,在 DeepMind 的一篇最新论文中,研究者提出了 DeepNash,它是一种无需人类演示、以无模型(model-free)方式学习 Stratego 自我博弈的智能体。DeepNask 击败了以往的 SOTA AI 智能体,并在该游戏最复杂的变体 Stratego Classic 中实现了专家级人类玩家的水平。

DeepNash 的核心是一种条理化、无模型的强化学习算法,研究者称为 Regularized Nash Dynamics(R-NaD)。DeepNash 将 R-NaD 与一个深度神经网络架构相结合,并收敛到纳什均衡,这意味着它学会了在激励竞争下比赛,并对试图利用它的竞争对手具有稳健性。

研究者表示,在学习算法中不部署任何搜索方法的情况下,AI 算法第一次能够在复杂棋盘游戏中达到人类专家水平,也是 AI 首次在 Stratego 游戏中实现人类专家水平。

DeepNash 方法的高级概览。

推荐:对人胜率 84%,DeepMind AI 首次在西洋陆军棋中达到人类专家水平。

相关文章
|
7月前
|
人工智能 自然语言处理 文字识别
DeepMind首发游戏AI智能体SIMA:开启虚拟世界的智能探索之旅
【4月更文挑战第3天】DeepMind推出了SIMA,一种能在多个3D环境中执行语言指令的智能体,标志着AI在理解和互动虚拟世界上的进步。SIMA通过多样化的训练数据学习导航、操作、决策等技能,并结合预训练模型处理高维度输入输出。尽管在复杂任务上仍有提升空间,SIMA展现了正向迁移能力和潜力,为AI研究和未来机器人技术铺平道路。然而,仍需解决鲁棒性、可控性、评估方法及道德安全问题。
154 4
DeepMind首发游戏AI智能体SIMA:开启虚拟世界的智能探索之旅
|
18天前
|
人工智能 编解码 网络架构
GenCast:谷歌DeepMind推出的AI气象预测模型
GenCast是由谷歌DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。该模型在97.2%的预测任务中超越了全球顶尖的中期天气预报系统ENS,尤其在极端天气事件的预测上表现突出。GenCast能在8分钟内生成预报,显著提高预测效率,并且已经开源,包括代码和模型权重,支持更广泛的天气预报社区和研究。
115 14
GenCast:谷歌DeepMind推出的AI气象预测模型
|
3月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
66 4
|
7月前
|
机器学习/深度学习 人工智能 数据挖掘
ICLR 49.9%论文疑有AI审稿
【5月更文挑战第20天】ICLR会议上一篇研究引发关注,推测近50%的论文可能由AI进行审稿,挑战传统审稿流程。研究者运用机器学习分析历史审稿数据,发现可能的AI审稿模式。该研究提出AI审稿可减轻审稿人负担,提高效率,但也面临证据不足、理解复杂学术概念限制及审稿行为多样性等问题。学术界需谨慎评估AI在审稿中的角色,以确保质量和公正性。[论文链接](https://arxiv.org/abs/2405.02150)
105 1
|
7月前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
96 3
|
7月前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
171 11
|
7月前
|
机器学习/深度学习 人工智能
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
【2月更文挑战第25天】ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
100 7
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
|
7月前
|
数据采集 人工智能 数据挖掘
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
393 0
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
|
7月前
|
机器学习/深度学习 人工智能 算法
AI大咖说-如何有效的读论文
# AI大咖李沐教你高效读论文 李沐,亚马逊资深首席科学家,MXNet框架作者,推荐其在B站的“跟李沐学AI”。他建议读论文分三步:粗读(标题、摘要、结论)、快速浏览(整体理解)和精读(深入细节)。通过这三遍阅读,判断论文是否相关,理解解决问题的方法和实验。5月更文挑战第13天
92 0
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
61 10