继 OpenAI 之后,DeepMind 开源深度学习训练平台 DeepMind Lab

简介:

继 OpenAI 之后,DeepMind 开源深度学习训练平台 DeepMind Lab

编者按:今年四月,由马斯克和知名风投专家 Peter Thiel、Y Combinator 创始人 Sam Altman 共同创立的 AI 研究组织对外开放了其 AI 训练平台 OpenAI Gym。近日,该组织宣布还将开源测试和训练 AI 通用能力的平台 Universe,届时 Universe 将提供 1000 多种不同的游戏和训练测试环境。今天,据彭博社消息,谷歌 DeepMind 实验室也将向大众及其他开发者开放其用于众多实验的迷宫类游戏平台

DeepMind 宣布,将把这一 AI 训练环境的整个源代码发布至开源社区 GitHub,并将其名称由 Labyrinth 更改为 DeepMind Lab。届时,所有开发者都能下载源代码并对其进行个性化设置,以此训练和测试原有的 AI 系统。

DeepMind 的这一举动又一次证明了该实验室对研究成果的开放态度。该公司上个月才宣布与动视暴雪 ( Activision Blizzard ) 联手将视频游戏《星际争霸 II 》转换为一个测试平台,以便所有 AI 研究人员都有机会制作出这款复杂游戏的人工智能系统。

DeepMind 的联合创始人之一 Shane Legg 表示,开放 DeepMind Lab 代码会让其他研究人员意识到它本身是否能被复制,研究人员可以在 DeepMind 的测试中评估他们自己的 AI 系统的表现。Shane Legg 说,“如果其他研究人员有兴趣的话,可以试试看会不会打败我们。”

对于 DeepMind 开放 DeepMind Lab 的行为,有人认为是为了与 OpenAI 展开竞争,也有人表示可能是因为谷歌一直被指责对自己的 AI 成果过于保护。 Legg 否认了这些说法,“一直以来,我们在机器学习上的研究都非常开放。我们每年发表的研究论文多达 100 篇,也曾对多个自有的 AI 智能体(Agent)进行了开源。”

DeepMind 训练 AI 玩迷宫游戏

谷歌 DeepMind 实验室凭借击败了世界围棋冠军李世石的阿尔法狗 AlphaGo 而成名,这一事件被认为是计算机科学领域的一大突破。虽然 AlphaGo 并非在 DeepMind Lab 平台上接受训练,但是谷歌母公司 Alphabet 计划将 DeepMind Lab 用到多个前沿项目当中。在这些项目里,AI 系统可以感知、记忆和规划。其中就包括最近的一项实验,研究人员在训练 AI 智能体(Agent)在游戏环境中寻找迷宫里散落的数字苹果,由于 DeepMind Lab 的帮助,训练时间大大减少了。

 Legg 表示,DeepMind Lab 比其他的 AI 训练环境要出色,因为其游戏环境非常复杂。DeepMind Lab以第一视角通过模拟智能体的眼睛进行观察,并且以 3D 的形式移动。据 Legg 透露,DeepMind Lab 的AI 智能体可以向任一方向移动和观测,这是其他 AI 训练测试平台做不到的。

Via bloomberg

【招聘】雷锋网(公众号:雷锋网)坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力,翻译及写作能力优良的外翻编辑加入。工作地点深圳。简历投递至 guoyixin@leiphone.com 。

相关文章:

Yann LeCun、Jeff Dean频繁亮相普及人工智能知识,全民AI时代来临|AI科技评论周刊

OPEN AI LAB,这个实验室如何加速人工智能的“进化”? | 深度


本文作者:刘子榆


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
2月前
|
机器学习/深度学习
神经网络与深度学习---验证集(测试集)准确率高于训练集准确率的原因
本文分析了神经网络中验证集(测试集)准确率高于训练集准确率的四个可能原因,包括数据集大小和分布不均、模型正则化过度、批处理后准确率计算时机不同,以及训练集预处理过度导致分布变化。
|
14天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
25 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
2天前
|
机器学习/深度学习 决策智能
深度学习中的对抗性训练
在这篇技术性文章中,我们将深入探讨深度学习中的对抗性训练。这种训练方法通过引入对抗性样本来提高模型的鲁棒性和泛化能力。文章将从对抗性训练的基本概念、原理以及实现方法等方面进行详细介绍,并结合实际案例分析其在实际应用中的效果和挑战。通过对这一主题的探讨,希望能够为读者提供有益的技术参考和启示。
16 1
|
1月前
|
人工智能 Serverless API
一键服务化:从魔搭开源模型到OpenAI API服务
在多样化大模型的背后,OpenAI得益于在领域的先发优势,其API接口今天也成为了业界的一个事实标准。
一键服务化:从魔搭开源模型到OpenAI API服务
|
7天前
|
机器学习/深度学习 存储 人工智能
深度学习之不遗忘训练
基于深度学习的不遗忘训练(也称为抗遗忘训练或持久性学习)是针对模型在学习新任务时可能会忘记已学习内容的一种解决方案。该方法旨在使深度学习模型在不断接收新信息的同时,保持对旧知识的记忆。
17 4
|
28天前
|
机器学习/深度学习 人工智能 监控
一文读懂deepSpeed:深度学习训练的并行化
DeepSpeed 是由微软开发的开源深度学习优化库,旨在提高大规模模型训练的效率和可扩展性。通过创新的并行化策略、内存优化技术(如 ZeRO)及混合精度训练,DeepSpeed 显著提升了训练速度并降低了资源需求。它支持多种并行方法,包括数据并行、模型并行和流水线并行,同时与 PyTorch 等主流框架无缝集成,提供了易用的 API 和丰富的文档支持。DeepSpeed 不仅大幅减少了内存占用,还通过自动混合精度训练提高了计算效率,降低了能耗。其开源特性促进了 AI 行业的整体进步,使得更多研究者和开发者能够利用先进优化技术,推动了 AI 在各个领域的广泛应用。
|
14天前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
35 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
1月前
|
测试技术 人机交互
没有等来OpenAI开源GPT-4o,等来了开源版VITA
【9月更文挑战第9天】近日,论文《Towards Open-Source Interactive Omni Multimodal LLM》介绍了VITA,一种基于Mixtral 8×7B的新型开源多模态大语言模型,能处理视频、图像、文本和音频等多模态数据,并提供先进的人机交互体验,填补了开源模型在多模态能力上的空白。经多任务学习及指令微调,VITA在多个基准测试中表现出色,但仍存在基础能力和嘈杂音频处理等方面的局限。更多详情见论文:https://arxiv.org/pdf/2408.05211
36 3
|
29天前
|
机器学习/深度学习 数据采集 数据可视化
深度学习实践:构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行分类
本文详细介绍如何使用PyTorch构建并训练卷积神经网络(CNN)对CIFAR-10数据集进行图像分类。从数据预处理、模型定义到训练过程及结果可视化,文章全面展示了深度学习项目的全流程。通过实际操作,读者可以深入了解CNN在图像分类任务中的应用,并掌握PyTorch的基本使用方法。希望本文为您的深度学习项目提供有价值的参考与启示。
|
1月前
|
机器学习/深度学习 存储 PyTorch
深度学习训练时混合精度的作用
在深度学习训练过程中,混合精度(Mixed Precision)是指同时使用不同的数值精度(如16位浮点数和32位浮点数)来进行计算。
16 2