超算Titan仅用一天生成AI神经网络,顶尖人类科学家则需数月

简介: 美国能源部橡树岭国家实验室利用超级计算机Titan,开发出一种人工智能系统,一天之内就能生成神经网络。而最聪明的数据科学家也需要好几个月才能开发出一个深度学习软件。即使是Google的AutoML,也需要数周的时间才能设计出一个优秀的图像识别系统。

美国能源部橡树岭国家实验室(下称ORNL)利用美国功能最强大的超级计算机,开发出一种人工智能系统,一天之内就能生成神经网络,而且比任何人类都做得更好。

即使是最聪明的数据科学家也需要好几个月才能开发出深度学习软件。即使是Google的AutoML,也需要数周的时间才能设计出一个优秀的图像识别系统。

利用超算,AI能在一天之内生成神经网络

橡树岭国家实验室(ORNL)的超级计算机Titan,拥有超过18,000个GPU。

7accbbef86dc5be7ff629fde0e09204d1af7fbd1

ORNL研究小组的算法叫做MENNDL,即深度学习的多节点进化神经网络。这个算法并不是用来创建那种收集可爱猫咪照片的AI系统。相反,MENNDL是测试和训练数以千计的潜在神经网络的工具,以处理特殊的科学问题。

ORNL的博士后研究员Steven Young指出,这就需要采取与Google和Facebook的 AI平台不同的方法。

他解释说:“我们发现那些(神经网络)通常不是许多问题的最优网络,因为我们的数据虽然可以被认为是图像,却其实是不同的。 这些图像和问题,与物体检测有很大不同。”

论文摘要

该研究团队发表了一篇名为Optimizing deep learning hyper-parameters through an evolutionary algorithm的论文。以下是论文摘要:

由于深度学习具有相对自动特征生成和高精度分类能力,近来在成像和语音应用中取得了许多成功。虽然这些模型通过数据驱动的方法学习参数,但通过超参数选择的模型选择(作为架构构造)仍然是单调乏味且高度直觉驱动的任务。为了解决这个问题,我们提出了多节点深度学习的进化神经网络(MENNDL),作为一种通过遗传算法进行超参数优化来实现计算集群网络选择自动化的方法。

75727cb1b83e2edfde71dcc8f26e81653955726a

论文地址:https://www.ornl.gov/content/optimizing-deep-learning-hyper-parameters-through-evolutionary-algorithm

应用案例

MENNDL曾应用在费米国家加速器实验室的粒子物理实验中。费米实验室的研究人员对中微子和高能亚原子粒子很感兴趣,这些粒子很少与正常物质相互作用,但可能是理解宇宙形成早期的关键。费米实验室的一个实验涉及到一种中微子相互作用的“快照”。

该团队想用AI系统对费米实验室的探测器数据进行分析和分类。 MENNDL在24小时内评估了500,000个神经网络。其最终解决方案优于人类科学家开发的定制模型。

在另一个涉及与孟菲斯圣裘德儿童研究医院合作的案例中,MENNDL把人类设计算法在脑组织三维电子显微镜图像内线粒体识别错误率减少了30%。

Young表示:“我们的AI能够在很短的时间内为特定的数据集设计网络,而且比人类做得更好。”

MENNDL能够定义最优超参数来处理特定的数据集,这使它脱颖而出。

“你并不总是需要一个庞大的网络。有时你只需要一个具有正确超参数的小型网络,”Young说。

项目展示

研究项目展示地址:http://ornlcda.github.io/MLHPC2015/presentations/4-Steven.pdf

e9a20d2f94f9c2ee816f9456d7c7daee04510d81

下个超算将更强大

ORNL的团队预计,实验室的下一个超级计算机Summit明年上线时,可能会产生更大的影响。虽然Summit只拥有4600个节点,但它将采用Nvidia最新最强的GPU和IBM的CPU。这意味着Summit将提供超过世界第五超算Titan的五倍以上的计算性能。

Young说:“Summit将以更快的速度解决更复杂的问题。”


原文发布时间为:2018-01-04

本文作者:Cecilia

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:超算Titan仅用一天生成AI神经网络,顶尖人类科学家则需数月

相关文章
|
3月前
|
机器学习/深度学习 人工智能 算法
AI 基础知识从 0.6 到 0.7—— 彻底拆解深度神经网络训练的五大核心步骤
本文以一个经典的PyTorch手写数字识别代码示例为引子,深入剖析了简洁代码背后隐藏的深度神经网络(DNN)训练全过程。
797 56
|
3月前
|
人工智能 安全 网络安全
2025攻防演习回顾,AI赋能下的网络安全新格局
网络安全实战攻防演习历经9年发展,已成为检验安全体系、洞察威胁趋势的重要手段。攻击呈现实战化、体系化特征,APT、0day、勒索攻击等手段升级,AI、大数据等新技术带来新风险。攻击入口多元化、工具智能化、API成重点目标,“AI+人工”协同攻击加剧威胁。面对挑战,企业需构建纵深防御体系,从被动防御转向主动对抗。瑞数信息通过动态安全技术与AI融合,实现0day防护、漏扫干扰、勒索应急等能力,打造WAAP超融合平台,助力关键基础设施构建智能、协同、前瞻的主动防御体系。
366 1
|
4月前
|
数据采集 人工智能 自然语言处理
AI邂逅青年科学家,大模型化身科研“搭子”
2025年6月30日,首届魔搭开发者大会在北京举办,涵盖前沿模型、MCP、Agent等七大论坛。科研智能主题论坛汇聚多领域科学家,探讨AI与科研融合的未来方向。会上展示了AI在药物发现、生物计算、气候变化、历史文献处理等多个领域的创新应用,标志着AI for Science从工具辅助向智能体驱动的范式跃迁。阿里云通过“高校用云”计划推动科研智能化,助力全球科研创新。
|
2月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
191 10
|
2月前
|
人工智能 运维 安全
AI来了,网络安全运维还能靠“人海战术”吗?
AI来了,网络安全运维还能靠“人海战术”吗?
225 28
|
2月前
|
人工智能 安全 网络安全
从不确定性到确定性,“动态安全+AI”成网络安全破题密码
2025年国家网络安全宣传周以“网络安全为人民,靠人民”为主题,聚焦AI安全、个人信息保护等热点。随着AI技术滥用加剧,智能化攻击频发,瑞数信息推出“动态安全+AI”防护体系,构建“三层防护+两大闭环”,实现风险前置识别与全链路防控,助力企业应对新型网络威胁,筑牢数字时代安全防线。(238字)
152 1
|
1月前
|
机器学习/深度学习 人工智能 监控
上海拔俗AI软件定制:让技术真正为你所用,拔俗网络这样做
在上海,企业正通过AI软件定制破解通用化难题。该模式以业务场景为核心,量身打造智能解决方案,涵盖场景化模型开发、模块化架构设计与数据闭环优化三大技术维度,推动技术与业务深度融合,助力企业实现高效、可持续的数字化转型。
|
6月前
|
数据采集 机器学习/深度学习 人工智能
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
638 0
|
2月前
|
人工智能 监控 数据可视化
如何破解AI推理延迟难题:构建敏捷多云算力网络
本文探讨了AI企业在突破算力瓶颈后,如何构建高效、稳定的网络架构以支撑AI产品化落地。文章分析了典型AI IT架构的四个层次——流量接入层、调度决策层、推理服务层和训练算力层,并深入解析了AI架构对网络提出的三大核心挑战:跨云互联、逻辑隔离与业务识别、网络可视化与QoS控制。最终提出了一站式网络解决方案,助力AI企业实现多云调度、业务融合承载与精细化流量管理,推动AI服务高效、稳定交付。
|
3月前
|
人工智能 自动驾驶 物联网
AI 来当“交通警察”:如何优化 5G 网络资源分配?
AI 来当“交通警察”:如何优化 5G 网络资源分配?
145 9

热门文章

最新文章

下一篇
oss云网关配置