华人主导,首届国际分布式AI大会开幕,最佳论文奖已出炉

简介: 首届华人学者主导的国际分布式 AI 大会近日在北京召开。本届大会主要关注强化学习,特别是多智能体问题的研究以及在工业领域的应用。本次大会的最佳论文是关于多智能体合作的研究,作者来自天津大学和华盛顿州大学。大会还邀请到了包括在内的姚期智、Victor Lesser、刘铁岩、Noam Brown、田渊栋等专家进行主题演讲。

近年来,随着人工智能研究的逐步深入,针对多智能体系统的研究逐渐成为强化学习的一个重要研究方向。在这一领域,研究者重点关注的问题是:决策不再由中心,而是自治的分布式多智能体决定。


因此,分布式人工智能(Distributed Artificial Intelligence)研究应运而生。而随着我国分布式人工智能的研究群体日益壮大,在工业界的应用越来越频繁,国内学术界迫切希望举办一个新的会议,成为国内分布式人工智能的高水平交流平台。2019 年 10 月 13 日至 15 日,第一届国际分布式 AI 大会在北京召开。这是首届华人带头的国际分布式 AI 学术会议。在本届大会上,参会嘉宾和学者们重点讨论了多智能体强化学习,以及这些研究在工业界的应用。此外,大会还邀请到了 AAAI、IJCAI、ACL、NeuralPS 大会部分接收论文作者,介绍和强化学习结合的工作。


大会情况


此次会议由多位华人学者以及国际知名学者共同发起,其中,南洋理工大学安波(大会共同主席)、清华大学唐平中(程序委员会共同主席)、南京大学高阳(研讨会主席)、MSRA 秦涛(工业论坛主席)、南京大学俞扬(赞助主席)、天津大学郝建业(宣传主席)都在组织者之列,会议共同主席之一 Michael Wooldridge 是牛津大学计算机系主任、IJCAI 理事会前主席。图灵奖得主姚期智院士任大会名誉主席。


本届大会共有多场演讲和报告,包括姚期智、Victor Lesser、刘铁岩的主旨演讲,以及 Noam Brown、田渊栋的专题演讲等。此外还有多篇论文的作者发表口头演讲。作为首届由华人发起和主导的分布式 AI 会议,参会人数众多,讨论非常热烈。据统计,本次共有 13 篇接收论文(长论文 11 篇、短论文 3 篇)。


微信图片_20211202015410.jpg

大会荣誉主席、图灵奖得主、清华大学教授姚期智院士做主题演讲。


本次大会共分为三天,首日是多场 Tutorial 活动,后两日则是主题演讲和论文口头报告时间。此外,大会在周一晚上宣布了最佳论文和荣誉提名论文。本文将介绍获奖论文的核心内容。


获奖情况


本届 DAI 大会宣布了最佳论文奖与最佳论文荣誉提名奖项。


最佳论文


本届 DAI 大会最佳论文由 Weixun Wang、Jianye Hao、Yixi Wang、Matthew E. Taylor 几位作者共同摘得。其中 Weixun Wang、Jianye Hao、Yixi Wang 来自天津大学,Matthew E. Taylor 来自华盛顿州大学。


微信图片_20211202015418.jpg


论文一作 Weixun Wang 对机器之心表示,这篇论文是一个多智能体交互的问题。考虑到真实世界更多的是一个多智能体问题,采用传统的「感知」方法是不够的,需要多智能体研究来更好地模拟真实情况。


  • 标题:Achieving Cooperation Through Deep Multiagent Reinforcement Learning in Sequential Prisoner』s Dilemmas
  • 作者:Weixun Wang, Jianye Hao, Yixi Wang, Matthew E. Taylor
  • 论文地址:http://www.adai.ai/dai/paper/29.pdf


迭代囚徒困境已经指导了社会困境问题方面的研究多年。然而,这一问题只分成了两种原子行为:合作和对抗。在真实世界的囚徒困境中,这些选择可能会有所延伸,而且不同的策略可能会带来一连串连锁反应,从而影响合作的程度。在本文中,研究者提出了一种名为序列囚徒困境(SPD)的问题,以便更好地捕捉前述特征。


在研究中,研究者提出了一个深度多智能体强化学习方法,可以探索在 SPD 问题中相互合作的演变过程。研究者的方法分为两步:第一步是线下过程,通过不同的合作级别整合策略,然后训练一个合作等级检测网络。第二步是在线过程,一个智能体基于检测到的对方的合作等级,逐渐调整并选择自身的策略。研究者认为,他们提出的方法可以在两个有代表性的二维 SPD 问题中展示:「苹果-梨」问题和「水果收集」问题。实验结果说明,研究提出的方法可以让智能体避免被具有掠夺性的对手剥削,同时和有合作意向的对手达成合作。


微信图片_20211202015421.jpg

图 1:合作程度检测网络


微信图片_20211202015425.jpg

图 4:在不同合作级别下,智能体获得的平均以及总奖励。合作程度从智能体 1 到智能体 2 分别为从左到右或从下到上逐渐提升。每个 cell 对应在不同策略对下的奖励。


最佳论文荣誉提名


本届 DAI 大会最佳论文荣誉提名授予了谷歌研究院(Google Research)的 Song Zuo,他从线性规划的新颖视角解读了迈尔森的最优拍卖理论。


微信图片_20211202015428.jpg


最优拍卖理论是由迈尔森(Myerson)于 1981 年提出的,该理论力图解决在给定信息分布的情况下,如何设计出某种制度来最大限度地激励经济活动的参与人,也就是最优合同的设计问题。


他们通过线性规划和原始对偶分析的角度重新分析了迈尔森的最优拍卖理论。他们将该理论作为优势策略和贝叶斯实现的线性规划问题进行处理,从而引导读者从一个全新的视角来理解最优拍卖设计问题。



在这篇论文中,研究者通过线性规划和原始对偶分析这两种完全不同的方法重新发现了迈尔森的最优拍卖理论。具体而言,他们考虑使用贝叶斯定理(贝叶斯激励相容+贝叶斯理性预期)和优势策略(优势策略激励相容+后理性预期),其中所有买家具有加法赋值和拟线性向量函数,并且所有估价的分布都在一个有限的支撑集中。当买家价值是单维和独立分布时,我们可以直接证明,贝叶斯实现线性规划的双目标仅仅是优势策略实现线性规划的双目标。换言之,贝叶斯和优势策略实现下的最优收益是相同的。根据观察结果,研究者通过将优势策略线性规划解释为熨平虚拟福利,并直接从中重新发现了迈尔森的最优拍卖理论。此外,研究者给出了 BIC=DSIC 的充分必要条件,即贝叶斯实现与优势策略实现的最优收益相同(BR_EV=DR_EV)。条件是当且仅当独立于虚拟价值函数的 DSIC 和后 IR 虚拟福利达到最大值时才能获得最优 DSIC 收益 DR-EV(一个买家的虚拟价值独立于其他买家的估价)。


作为首届国际分布式 AI 大会,DAI 2019 由华人和国际学者主导,彰显了华人力量在 AI 研究领域逐渐增强。近年来,随着中国的学术实力不断增强,越来越多的学术顶会移步中国。IJCAI2019 在澳门召开,EMNLP 也在今年花落香港。更多学术会议在中国举办,有助于国内外顶尖 AI 人才交流,未来会催生出跨学科多领域的融合研究成果。


10月16日晚,NVIDIA GPU 计算专家团队高级工程师季光博士将带来线上主题分享:利用 TensorRT 自由搭建高性能推理模型。点击阅读原文立即免费报名。


微信图片_20211202015431.jpg

相关文章
|
2月前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第17天】北京大学计算机学院张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可能导致误诊和医疗事故,引起学术界和工业界的广泛关注。研究强调了医疗AI系统安全性评估的重要性。
46 1
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
o1医学领域大胜GPT-4,性能暴涨!顶尖华人团队激动发文:离AI医生越来越近了
【10月更文挑战第29天】近日,一支顶尖华人团队发布论文《A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?》,揭示了OpenAI最新语言模型o1在医学领域的卓越表现。研究显示,o1在概念识别、文本总结、问答等任务上远超GPT-4,显著提升了医学领域的AI应用水平,向实现AI医生的目标迈进了一大步。
57 3
|
27天前
|
机器学习/深度学习 人工智能 分布式计算
【AI系统】分布式通信与 NVLink
进入大模型时代后,AI的核心转向大模型发展,训练这类模型需克服大量GPU资源及长时间的需求。面对单个GPU内存限制,跨多个GPU的分布式训练成为必要,这涉及到分布式通信和NVLink技术的应用。分布式通信允许多个节点协作完成任务,而NVLink则是一种高速、低延迟的通信技术,用于连接GPU或GPU与其它设备,以实现高性能计算。随着大模型的参数、数据规模扩大及算力需求增长,分布式并行策略,如数据并行和模型并行,变得至关重要。这些策略通过将模型或数据分割在多个GPU上处理,提高了训练效率。此外,NVLink和NVSwitch技术的持续演进,为GPU间的高效通信提供了更强的支持,推动了大模型训练的快
40 0
|
2月前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第16天】北京大学张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可使攻击者通过特定数据样本误导AI诊断,引发误诊风险。此发现引起广泛关注,强调了医疗AI安全评估的重要性。
62 4
|
2月前
|
人工智能 文字识别 Java
SpringCloud+Python 混合微服务,如何打造AI分布式业务应用的技术底层?
尼恩,一位拥有20年架构经验的老架构师,通过其深厚的架构功力,成功指导了一位9年经验的网易工程师转型为大模型架构师,薪资逆涨50%,年薪近80W。尼恩的指导不仅帮助这位工程师在一年内成为大模型架构师,还让他管理起了10人团队,产品成功应用于多家大中型企业。尼恩因此决定编写《LLM大模型学习圣经》系列,帮助更多人掌握大模型架构,实现职业跃迁。该系列包括《从0到1吃透Transformer技术底座》、《从0到1精通RAG架构》等,旨在系统化、体系化地讲解大模型技术,助力读者实现“offer直提”。此外,尼恩还分享了多个技术圣经,如《NIO圣经》、《Docker圣经》等,帮助读者深入理解核心技术。
SpringCloud+Python 混合微服务,如何打造AI分布式业务应用的技术底层?
|
2月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
2月前
|
人工智能 算法 安全
阿里云国际版设置四层AI智能防护
阿里云国际版设置四层AI智能防护
|
3月前
|
人工智能
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
【9月更文挑战第15天】近年来,人工智能领域取得了显著进展,但智能体系统的设计仍需大量人力与专业知识。为解决这一问题,UBC研究人员提出了“自动智能体系统设计(ADAS)”新方法,通过基于代码的元智能体实现智能体系统的自动化设计与优化。实验结果表明,ADAS设计的智能体在多个领域中表现优异,尤其在阅读理解和数学任务上取得了显著提升。尽管如此,ADAS仍面临安全性、可扩展性和效率等挑战,需进一步研究解决。论文详情见链接:https://arxiv.org/pdf/2408.08435。
64 4
|
3月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
66 4
|
4月前
|
机器学习/深度学习 人工智能 负载均衡
【AI大模型】分布式训练:深入探索与实践优化
在人工智能的浩瀚宇宙中,AI大模型以其惊人的性能和广泛的应用前景,正引领着技术创新的浪潮。然而,随着模型参数的指数级增长,传统的单机训练方式已难以满足需求。分布式训练作为应对这一挑战的关键技术,正逐渐成为AI研发中的标配。
212 5

热门文章

最新文章