论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》

简介:

应用场景导读:多智能体系统,例如移动传感器、无人运载器等,作为分布式人工智能研究的一个重要分支,由于其具有较强的容错性、鲁棒性和可扩展性等优点,被广泛地应用于军事、工农业生产、医学、交通、服务等各个领域。多智能体系统是由多个具有计算和移动能力的智能体所组成的集合,其中每个智能体是一个物理的或抽象的实体,能作用于自身和环境,并与其它智能体通讯。

论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》

标题:

具有社会意识的多智能体学习:面向社会最优解

摘要:

在多智能体系统中,学习能力对每个智能体来说至关重要,这关乎其在动态环境中面对未知对手时如何正常反应。从系统设计者的角度说,非常希望智能体能学会面向社会最优解的协作,同时避免被自私的对手利用。为此,我们提出一种新颖的梯度提升算法(SA-IGA),通过将社会意识纳入策略更新过程来加强基本的梯度提升算法。我们从理论上分析了基于动态系统理论的SA-IGA的学习动态,并且SA-IGA在包括对称游戏的众多游戏中都有线性动态。对两个代表游戏(“囚徒困境”游戏和协调游戏)的学习动态进行了详细分析。在SA-IGA概念的基础上,我们进一步提出一个基于Q学习更新规则的多智能体学习算法,称为SA-PGA。仿真结果表明,SA-PGA智能体相比以前面向有条件联合行动学习者(CJAL)的社会最优准则,可以获得更高的社会福利,并通过纳什均衡解决方案对独立理性对手具有可抗性。


第一作者简介:

李晓红,女,1965年9月出生,工学博士学位,天津大学计算机及信息技术系、教授,博士生导师。计算机学会高级会员,ACM会员、软件工程专委会委员;全国高等学校计算机教育研究会 常务理事;天津大学女工委员,学院工会副主席。近年来致力于安全软件工程、可信软件及信息安全领域的研究工作。

计算机学会高级会员,ACM会员、软件工程专委会委员;全国高等学校计算机教育研究会 常务理事;国家科技奖励评审专家;教育部学位与研究生教育发展中心学位论文评审、学科建设和评估咨询专家 ;《计算机学报》、《计算机科学》等杂志审稿专家;软件工程、信息安全相关领域国际期刊、国际会议审稿专家;计算机学院学位委员会委员、学术委员会委员、学科建设委员会成员、教学指导委员会委员兼秘书;学院985专家组成员兼秘书;天津大学女工委员,学院工会副主席。

近年来主持或参与完成国家级、省部级以及横向科研课题近20项,近年来已发表学术论文50余篇,其中学位与研究生教育重要期刊20多篇,国际会议20多篇,被EI检索20多篇, SCI检索6篇。申报国家发明专利20余项,已授权6项。软件著作权4项。专著1部,获省部级科技奖1项。现作为项目负责人主持国家基金重点项目1项(子课题负责人)、国家基金面上项目1项,天津市基础重点项目1项、企业合作项目1项。


via PRICAI 2016

论文原文件下载

雷锋网按: 本文由雷锋网(公众号:雷锋网)独家编译,未经许可禁止转载!

论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》


本文作者:陈杨英杰


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
8月前
|
人工智能 数据处理 API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
1363 6
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
|
8月前
|
人工智能 测试技术 API
构建AI智能体:二、DeepSeek的Ollama部署FastAPI封装调用
本文介绍如何通过Ollama本地部署DeepSeek大模型,结合FastAPI实现API接口调用。涵盖Ollama安装、路径迁移、模型下载运行及REST API封装全过程,助力快速构建可扩展的AI应用服务。
2516 7
|
8月前
|
人工智能 运维 算法
AI来了,运维不慌:教你用人工智能把团队管理提速三倍!
AI来了,运维不慌:教你用人工智能把团队管理提速三倍!
925 8
|
8月前
|
人工智能 运维 安全
加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时
在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。
|
8月前
|
人工智能 搜索推荐 数据可视化
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
801 115
|
8月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
1124 120
|
8月前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
2821 18
构建AI智能体:一、初识AI大模型与API调用
|
8月前
|
存储 机器学习/深度学习 人工智能
构建AI智能体:三、Prompt提示词工程:几句话让AI秒懂你心
本文深入浅出地讲解Prompt原理及其与大模型的关系,系统介绍Prompt的核心要素、编写原则与应用场景,帮助用户通过精准指令提升AI交互效率,释放大模型潜能。
1364 6

热门文章

最新文章