让两个 AI 一起玩游戏,他们会合作还是打架?

简介:

相信自从阿尔法狗战胜人类之后,不少人想干脆两个人工智能直接对决算了。

Google 的 Deepmind 团队还真的做了一件类似的事,不过设置有点稍稍不同,这来源于试验的目的并不是要找哪个人工智能玩围棋更腻害,而是,人工智能在特定的有些规则环境下,究竟是会合作还是竞争?

毕竟,未来人工智能在这个社会中,要处理的事情可能很多,小到指挥交通,大到国家的经济运行,可能都有人工智能的参与。然而人类发展的历程告诉我们,有时候合作也许是对大家最好。

为了探讨这个问题,DeepMind 做了个实验,说将几个 AI 机器人置于一系列的“社交困境”中,在这些情况下,个人可以从背叛他人中获利,但如果所有人都那些自私,那就没有赢家。这是不是让你想起了诺贝尔奖得主纳什提出的“博弈论”里面的“囚徒困境”?

Deepmind 做实验的方法就是......让这些 AI 们一起玩两个简单的电子游戏。

第一个电子游戏叫“捡苹果”,两名玩家要在中间的一道管子上收集苹果,谁捡的苹果多谁赢。同时他们都有一个技能,通过用激光来阻碍对方的行动,让对手暂时在游戏中消失,前者就又机会收集更多的苹果了。

第二个游戏叫“狼群”,两名玩家需要在一个充满困难和障碍的环境中捕猎一只猎物。不过不只是抓道猎物那名玩家可以得分,而是当猎物被捕时,所有靠近猎物的玩家都可以得分。

实验结果略有趣,但是不算意外,这些人工智能都会根据不同的情景和规则,调整他们的行为方式,时而合作时而敌对。

比如,在“捡苹果”游戏中,当苹果数量很充足的时候,这些人工智能似乎懒得去动手阻碍别人,而是努力在自顾自地捡苹果。然而当苹果的总数逐渐减少,他们使用激光技能的次数也开始增多了。文科生大概开始在YY各种什么人在极端情况下展现最真实的人性,还有什么马克思的原始共产主义社会理论被打破之类的

但这是一个机器人,接下来的事情就更有趣了,当引入一个运算能力更强的人工智能时,他却倾向于无论剩下多少苹果,都会去阻碍对手。似乎更聪明的AI展现出来的是,在这个游戏中,什么时候都要好斗。

不要这是不是就是意味着,AI 认为,阻碍别人就是最好的战略呢?不一定哦。

研究人员认为,更高级的人工智能在游戏中使用激光的次数更多,有可能只是因为发激光这个动作更难.AI需要把武器瞄准目标,通过跟踪它们的踪迹,这样的举动需要更多的运行能力,而且还会占用宝贵的捡苹果时间。所有除非玩家觉得发激光划得来,否则他大概会乖乖一起捡苹果。

那么在“狼群”中游戏中又如何?

这个游戏的情况则恰恰相反,更聪明的 AI,在这个游戏里更倾倾和和其他玩家合作。研究人员解释,这也是因为跟其他玩家一起追踪和围捕猎物,要求更多算力......

不得不说,不同级别的机器人模式转变的理由,真是十分实在。即便AI展现出来的合作与好斗的程度,跟他们的“能力”有关,但无论如何,研究结果都说明,人工智能的行为模式会随着它们所面临的规则而变。如果游戏规则鼓励的是好斗的行为,也就是说你要好斗才能拿高分,AI会变得好斗;如果游戏规则鼓励合作行为,那他们会表现得更为为合作。显然上面的游戏中,第一个捡苹果的游戏更像一个零和博弈,你捡的苹果多了我的就少;第二个则则正和博弈,合作时双方至少一方的利益会增加,也就是整体利益会增加。

这也告诉告诉了人工智能研究的相关人员,未来在涉及多个AI交互的场景中,确保制定的“游戏规则”适当,是控制AI行为很重要的部分。就像研究人员在博客中写道:

这个实验之后,我们似乎更能理解与控制多方参与的系统,比如经济运行,交通系统或者地球生态健康的维护,这些都依靠我们持续的合作。

如果把上述游戏中的AI换成人,得出的结论很像社会心理学的基本假设,倾向于将人的行为模式归结到环境变化。然而人的不可控性在于复杂的七情六欲,还有内心对于机器而言,还没有性格可言,在同一环境下的不同行为,变量只是运算能力。

也许囚徒困境不会是个问题,因为即便信息不对称,只要你给我足够的算力,我可以算出合作是最优解。但人呢?即便智商够高,也不一定能相信坐在隔壁的人不会背叛我。

不过如果出现了“西部世界”的情况,机器人有了记忆和意识,不知道他们还会不会纯粹靠智商思考?

本文来自开源中国社区 [http://www.oschina.net]

目录
相关文章
|
1月前
|
人工智能 自然语言处理 IDE
被 AI 写的游戏代码砸中是什么感觉 | 10 分钟打造你的超级 AI 编码助手
被 AI 写的游戏代码砸中是什么感觉 | 10 分钟打造你的超级 AI 编码助手
|
25天前
|
人工智能 JavaScript 前端开发
中国象棋AI在线对弈游戏源码
植物大战僵尸Javascript版web游戏源码,非常强大,1比1还原电脑版植物大战僵尸游戏,带背景音乐,玩法和原版一模一样。
25 0
|
27天前
|
人工智能 移动开发 算法
中国象棋AI在线对弈游戏源码
这是一款html5小游戏,主要功能在于js,带一套皮肤、内置ai算法,有能力的可以自行修改。
63 0
中国象棋AI在线对弈游戏源码
|
29天前
|
人工智能 文字识别 安全
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的SIMA项目旨在创建一个通用AI代理,该代理能在多种3D环境中执行复杂任务,通过语言指令与环境交互。目标是让AI理解并执行600多种动作,包括导航和建造等。使用多样化的3D环境训练,结合零基础训练和预训练模型,如SPARC和Phenaki,以增强语言理解和行动执行。评估方法多角度,包括人类评估,但也面临效率和成本挑战。项目注重伦理安全,但AI在复杂环境中的性能仍有提升空间。DeepMind将继续优化代理的鲁棒性,扩大研究范围,以推动通用人工智能的发展。
21 2
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
|
1月前
|
人工智能 算法 UED
OpenAI与法国和西班牙媒体巨头合作:利用内容进行训练AI
【2月更文挑战第26天】OpenAI与法国和西班牙媒体巨头合作:利用内容进行训练AI
24 7
OpenAI与法国和西班牙媒体巨头合作:利用内容进行训练AI
|
1月前
|
人工智能 信息无障碍 UED
网易AI Eyes获得iF设计奖,盲人也能“亲眼”玩游戏!
【2月更文挑战第17天】网易AI Eyes获得iF设计奖,盲人也能“亲眼”玩游戏!
32 2
网易AI Eyes获得iF设计奖,盲人也能“亲眼”玩游戏!
|
8月前
|
人工智能 搜索推荐 安全
用AI制作游戏应用高点击率图标!
用AI制作游戏应用高点击率图标!
162 0
|
8月前
|
人工智能 Python
【Python】利用tkinter开发AI对战井字棋游戏
【Python】利用tkinter开发AI对战井字棋游戏
177 0
|
4月前
|
人工智能 弹性计算 搜索推荐
阿里云张献涛:拥抱第三次云计算浪潮,云上驱动AI原生游戏
由国家新闻出版署主管,广东省新闻出版局、中共广州市委宣传部支持,中国音像与数字出版协会、广州开发区管委会、广州市黄埔区人民政府主办,中国音数协游戏工委、中共广州市黄埔区委宣传部、黄埔文化(广州)发展集团有限公司、黄埔文商旅(广州)集团有限公司承办的2023年度中国游戏产业年会大会12月15日在广州黄埔区举办。
|
9月前
|
人工智能 达摩院 安全
巨人网络与阿里云签署合作备忘录,建立 “游戏 + AI”全面合作
阿里云达摩院也将为双方合作提供深度技术支持。目前国内最大、由阿里云达摩院主导维护的 AI 模型开源社区魔搭社区 ModelScope ,将结合巨人网络业务需求场景,进行 AI + 创作工具、游戏 + AI 玩法的场景挖掘,持续迭代升级模型能力,提升产品性能。