7 Papers & Radios | SIGGRAPH 2022最佳博士论文;DeepMind AI西洋陆军棋中对人胜率84%

简介: 7 Papers & Radios | SIGGRAPH 2022最佳博士论文;DeepMind AI西洋陆军棋中对人胜率84%
本周重要论文包括 ACM SIGGRAPH 2022 最佳博士论文及五篇最佳论文。


目录:

  1. Acquiring Motor Skills Through Motion Imitation and Reinforcement Learning
  2. Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency
  3. Translating Images into Maps
  4. CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking
  5. FedTree: A Fast, Effective, and Secure Tree-based Federated Learning System
  6. Quantum Tunneling Based Ultra-Compact and Energy Efficient Spiking Neuron Enables Hardware SNN
  7. Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning
  8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:Acquiring Motor Skills Through Motion Imitation and Reinforcement Learning


摘要:作者提出了动作模仿技术,使智能体能够通过模仿演示学习大量高度动态和运动行为。智能体无需为每个感兴趣的技能设计控制器或奖励函数,只需接受预期技能所需要的一些运动示例片段即可。这样一来,作者提出的框架就可以合成一个紧密复刻目标行为的控制器。

在过程中,作者首先提出一个动作模仿框架,使模拟智能体能够模仿参考动作片段中的复杂行为,包括步行和奔跑等常见的运动技能以及杂技和武术等更复杂的运动行为。智能体学习产生稳健和栩栩如生的行为,它们在外观上与现实中演员做出的动作几乎难以区分。

最后,作者又开发了相关模型,它们能够重复使用并组合从动作模仿中学得的技能,以解决具有挑战性的下游任务。除了为模拟智能体开发控制器外,作者的方法还可以为现实世界运行的机器人合成控制器。他通过为双足和四足机器人的各种敏捷运动技能开发控制器,证明了自己方法的有效性。


推荐:ACM SIGGRAPH 2022 最佳博士论文。

论文 2:Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency


摘要:该研究提出了一个受神经学启发的感知模型来预测人眼反应延迟期,作为在屏幕上被观察图像特征的函数。该模型可以作为预测和改变电子竞技与 AR/VR 应用中反应延迟的指标。

(a)电竞目标搜索中的眼跳反应;(b)模型在目标候选者上的预测。

推荐:ACM SIGGRAPH 2022 最佳论文之一。

论文 3:Translating Images into Maps


摘要:来自萨里大学的研究者引入了注意力机制,将自动驾驶的 2D 图像转换为鸟瞰图,使得模型的识别准确率提升了 15%。这项研究在不久前落幕的 ICRA 2022 会议上获得了杰出论文奖

与以往的方法不同,这项研究将 BEV 的转换视为一个「Image-to-World」的转换问题,其目标是学习图像中的垂直扫描线和 BEV 中的极射线(polar ray)之间的对齐。在对齐模型上,研究者采用了 Transformer 这种基于注意力的序列预测结构。研究者将基于 Transformer 的对齐模型嵌入一个端到端学习公式中,该公式以单目图像及其固有矩阵为输入,然后预测静态和动态类的语义 BEV 映射。

模型架构。

推荐:ICRA 2022 杰出论文:把自动驾驶 2D 图像转成鸟瞰图,模型识别准确率立增 15%。

论文 4:CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking


摘要:本文介绍一个刚刚发表在 NAACL 上的中文的事实核查数据集 CHEF(受 HotpotQA 启发,是不是可以搞一个吃饭数据集宇宙 XD),论文作者来自清华,剑桥和 UIC 的 Philip Yu 组。据我们所知,这是第一个基于证据的中文事实核查数据集

目前事实核查的数据集大致可以分为两类:人工的(Artificial)和天然的 (Natural)。

推荐:第一个基于证据的中文事实核查数据集。

论文 5:FedTree: A Fast, Effective, and Secure Tree-based Federated Learning System

摘要:近日,来自新加坡国立大学和清华大学的研究者提出了一种专注于训练树模型的联邦学习新系统 FedTree。FedTree 的架构共有 5 个模块:接口、环境、框架、隐私保护以及模型

FedTree 系统架构图。

推荐:专为决策树打造,新加坡国立大学 & 清华大学联合提出快速安全的联邦学习新系统。

论文 6:Quantum Tunneling Based Ultra-Compact and Energy Efficient Spiking Neuron Enables Hardware SNN


摘要:在最近的一项研究中,来自孟买理工学院的研究者实现了超低功耗人工神经元,允许 SNN 排列更紧凑。他们创造了一种 SNN,这种 SNN 依赖于一种新的、紧凑的电流源来为电容器充电,被称为 BTBT( band-to-band-tunneling current)

在 BTBT 中,量子隧穿电流以极低的电流使电容器充电,这意味着所需的能量更少。BTBT 方法还省去了用较大电容来存储大量的电流,为芯片上更小的电容铺平了道路,从而节省了空间。研究人员使用 45 纳米商用绝缘硅片晶体管技术对 BTBT 神经元方法进行测试,结果显示这种方法节省了大量的能源和空间。他们还宣布了一种新的低功耗 AI 芯片,它可以实现所谓的脉冲神经网络

孟买理工学院研究者,包括 Maryam Shojaei Baghini(左一) 和 Udayan Ganguly(右一) 教授。

推荐:超低功耗 AI 芯片:神经脉冲只需同类神经网络能量的 0.02%。

论文 7:Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

摘要:近日,在 DeepMind 的一篇最新论文中,研究者提出了 DeepNash,它是一种无需人类演示、以无模型(model-free)方式学习 Stratego 自我博弈的智能体。DeepNask 击败了以往的 SOTA AI 智能体,并在该游戏最复杂的变体 Stratego Classic 中实现了专家级人类玩家的水平。

DeepNash 的核心是一种条理化、无模型的强化学习算法,研究者称为 Regularized Nash Dynamics(R-NaD)。DeepNash 将 R-NaD 与一个深度神经网络架构相结合,并收敛到纳什均衡,这意味着它学会了在激励竞争下比赛,并对试图利用它的竞争对手具有稳健性。

研究者表示,在学习算法中不部署任何搜索方法的情况下,AI 算法第一次能够在复杂棋盘游戏中达到人类专家水平,也是 AI 首次在 Stratego 游戏中实现人类专家水平。

DeepNash 方法的高级概览。

推荐:对人胜率 84%,DeepMind AI 首次在西洋陆军棋中达到人类专家水平。

相关文章
|
15天前
|
人工智能 数据可视化 数据挖掘
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。
114 34
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
106 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
2月前
|
人工智能 自然语言处理 机器人
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架,可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力,通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题,研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集,涵盖多样化的场景和相机运动。
208 2
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
|
2月前
|
人工智能 安全 测试技术
本周 AI Benchmark 方向论文推荐
由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench,是一个专为评估大型语言模型(LLMs)在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例,专注于新功能的实现。研究表明,即使是先进的 LLMs 在此任务中的表现仍远低于预期,揭示了仓库级代码开发的重大挑战。
99 0
|
2天前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
54 18
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
|
15天前
|
机器学习/深度学习 人工智能 算法
医学AI推理新突破!MedReason:这个AI把医学论文变「会诊专家」,8B模型登顶临床问答基准
MedReason是由多国顶尖学术机构联合开发的医学推理框架,通过知识图谱增强大模型在医疗领域的逻辑推理能力,其8B参数模型在复杂临床场景中达到最先进水平。
112 18
医学AI推理新突破!MedReason:这个AI把医学论文变「会诊专家」,8B模型登顶临床问答基准
|
26天前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
509 11
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
2月前
|
人工智能 自然语言处理
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
谷歌推出专为药物研发设计的TxGemma大模型,具备药物特性预测、生物文献筛选、多步推理等核心能力,提供20亿至270亿参数版本,显著提升治疗开发效率。
100 7
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
|
2月前
|
人工智能 vr&ar 图形学
谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景
牛津大学与谷歌联合推出的Bolt3D技术,能在单个GPU上仅用6.25秒从单张或多张图像生成高质量3D场景,基于高斯溅射和几何多视角扩散模型,为游戏、VR/AR等领域带来革命性突破。
80 2
谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景
|
17天前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
174 29

热门文章

最新文章