论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》

简介:

应用场景导读:多智能体系统,例如移动传感器、无人运载器等,作为分布式人工智能研究的一个重要分支,由于其具有较强的容错性、鲁棒性和可扩展性等优点,被广泛地应用于军事、工农业生产、医学、交通、服务等各个领域。多智能体系统是由多个具有计算和移动能力的智能体所组成的集合,其中每个智能体是一个物理的或抽象的实体,能作用于自身和环境,并与其它智能体通讯。

论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》

标题:

具有社会意识的多智能体学习:面向社会最优解

摘要:

在多智能体系统中,学习能力对每个智能体来说至关重要,这关乎其在动态环境中面对未知对手时如何正常反应。从系统设计者的角度说,非常希望智能体能学会面向社会最优解的协作,同时避免被自私的对手利用。为此,我们提出一种新颖的梯度提升算法(SA-IGA),通过将社会意识纳入策略更新过程来加强基本的梯度提升算法。我们从理论上分析了基于动态系统理论的SA-IGA的学习动态,并且SA-IGA在包括对称游戏的众多游戏中都有线性动态。对两个代表游戏(“囚徒困境”游戏和协调游戏)的学习动态进行了详细分析。在SA-IGA概念的基础上,我们进一步提出一个基于Q学习更新规则的多智能体学习算法,称为SA-PGA。仿真结果表明,SA-PGA智能体相比以前面向有条件联合行动学习者(CJAL)的社会最优准则,可以获得更高的社会福利,并通过纳什均衡解决方案对独立理性对手具有可抗性。


第一作者简介:

李晓红,女,1965年9月出生,工学博士学位,天津大学计算机及信息技术系、教授,博士生导师。计算机学会高级会员,ACM会员、软件工程专委会委员;全国高等学校计算机教育研究会 常务理事;天津大学女工委员,学院工会副主席。近年来致力于安全软件工程、可信软件及信息安全领域的研究工作。

计算机学会高级会员,ACM会员、软件工程专委会委员;全国高等学校计算机教育研究会 常务理事;国家科技奖励评审专家;教育部学位与研究生教育发展中心学位论文评审、学科建设和评估咨询专家 ;《计算机学报》、《计算机科学》等杂志审稿专家;软件工程、信息安全相关领域国际期刊、国际会议审稿专家;计算机学院学位委员会委员、学术委员会委员、学科建设委员会成员、教学指导委员会委员兼秘书;学院985专家组成员兼秘书;天津大学女工委员,学院工会副主席。

近年来主持或参与完成国家级、省部级以及横向科研课题近20项,近年来已发表学术论文50余篇,其中学位与研究生教育重要期刊20多篇,国际会议20多篇,被EI检索20多篇, SCI检索6篇。申报国家发明专利20余项,已授权6项。软件著作权4项。专著1部,获省部级科技奖1项。现作为项目负责人主持国家基金重点项目1项(子课题负责人)、国家基金面上项目1项,天津市基础重点项目1项、企业合作项目1项。


via PRICAI 2016

论文原文件下载

雷锋网按: 本文由雷锋网(公众号:雷锋网)独家编译,未经许可禁止转载!

论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》


本文作者:陈杨英杰


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
2月前
|
人工智能 算法 计算机视觉
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
139 62
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
|
5天前
|
传感器 人工智能 机器人
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
27 1
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
|
7天前
|
人工智能 监控 自动驾驶
Migician:清北华科联手放大招!多图像定位大模型问世:3秒锁定跨画面目标,安防监控迎来AI革命!
Migician 是北交大联合清华、华中科大推出的多模态视觉定位模型,支持自由形式的跨图像精确定位、灵活输入形式和多种复杂任务。
59 3
Migician:清北华科联手放大招!多图像定位大模型问世:3秒锁定跨画面目标,安防监控迎来AI革命!
|
7天前
|
人工智能 分布式计算 监控
AgentSociety:告别纸上谈兵!AI社会模拟器预判政策漏洞:输入新规秒看30年后社会形态
AgentSociety 是清华大学推出的基于大语言模型的社会模拟器,通过构建类人心智的智能体模拟复杂社会行为,适用于政策沙盒测试、危机预警等场景。
46 6
|
5天前
|
人工智能 网络协议 IDE
使用通义灵码AI高效学习muduo网络库开发指南
Muduo 是一个基于 C++11 的高性能网络库,支持多线程和事件驱动,适用于构建高效的服务器和应用程序。它提供 TCP/IP 协议支持、异步非阻塞 I/O、定时器、异步日志等功能,并具备跨平台特性。通过 Git 克隆 muduo 仓库并切换至 C++17 分支可开始使用。借助 AI 工具如 Deepseak-v3,用户可以更便捷地学习和理解 Muduo 的核心模块及编写测试用例,提升开发效率。
|
2月前
|
人工智能 自然语言处理 调度
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
Casevo 是中国传媒大学推出的开源社会传播模拟系统,结合大语言模型和多智能体技术,支持复杂社会网络建模与动态交互,适用于新闻传播、社会计算等领域。
126 22
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
|
2月前
|
数据采集 人工智能 安全
1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化
在人工智能领域,大型语言模型(LLMs)的发展迅速,但如何提升其指令遵循能力仍是一大挑战。论文提出MATRIX-Gen,一个基于多智能体模拟的AI社会模拟器。MATRIX-Gen通过模拟智能体交互生成多样化的现实场景,不依赖预定义模板,从而合成高质量指令数据。它包括MATRIX模拟器和MATRIX-Gen指令生成器,能生成监督微调、偏好微调及特定领域的数据集。实验表明,使用MATRIX-Gen合成的数据集微调后的模型在多个基准测试中表现出色,显著优于现有方法。然而,该方法也面临智能体和场景规模对数据质量的影响等挑战。
107 33
|
2月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
158 11
|
2月前
|
机器学习/深度学习 人工智能 安全
SentinelOne人工智能安全态势管理(AI-SPM)
随着人工智能(AI)的广泛应用,AI基础设施的安全性变得至关重要。SentinelOne的AI安全态势管理(AI-SPM)解决方案专注于保护AI工作负载,提供自动化盘点、错误配置检测及攻击路径分析,确保AI系统的安全性。咨询采购请联系:王涛📞13818802872 📨wangtao@mfreelink.com。更多信息,请访问上海甫连信息。
80 7
|
2月前
|
人工智能 自动驾驶 机器人
AI元年:2024年人工智能发展大事纪
3分钟了解2024年人工智能AI领域都发生了哪些改变我们生活和生产方式的大事儿。
325 2
AI元年:2024年人工智能发展大事纪

热门文章

最新文章