AI新动态:AI自造AI的速度将提升240倍

简介: 下个月,麻省理工学院(MIT)的研究团队将展示所谓的“神经架构搜索”算法,该算法可以将AI优化AI的过程加快240倍或者更多。
TB1k72nPmzqK1RjSZFjXXblCFXa.png

雷锋网注:【 图片来源:IEEE  所有者:iStockphoto 】

自2017年以来,研究人员一直使用AI神经网络来帮助设计更好更快的AI神经网络。

迄今为止,这种应用在很大程度上是一种学术追求,主要是因为这种方法需要数万个GPU hours。然而,下个月,麻省理工学院(MIT)的研究团队将展示所谓的“神经架构搜索”算法,该算法可以将AI优化AI的过程加快240倍或者更多。

优化后的AI速度更快,精准度更高。而这个新算法的出现将助力优化后的AI广泛应用于图像识别算法和其他相关应用。

MIT电子工程和计算机科学的助教Song Han表示:“我们团队在模型大小、推理延迟、准确性和模型容量等多个方面做出了权衡。”他还补充说:“这些因素组成了一个巨大的设计空间。以前,人们都在设计基于人类启发的神经网络。而新算法试图将这种劳动密集型的、基于人类启发的方式转变为一个基于学习的、基于AI的设计方式。就像AI可以学习下棋一样,AI也可以学习设计一个神经网络。”

就像在围棋和国际象棋中获胜的AI程序教给大师们新策略一样,AI优化AI这一新的探索为设计AI神经网络提供了全新的方法。此类神经网络被称为卷积神经网络(CNN),MIT团队研究的新算法促进了这种神经网络的发展。CNN通常作为图像识别程序的神经网络。除此之外,它在自然语言处理和药物发现等领域也有所应用。

MIT的Han指出,一旦他们团队的算法建立起最优的CNN,得到系统分类图像的速度很可能是其他神经架构搜索构建的AI的1.8倍。

Han说,团队能够以如此惊人的速度精确定位最优的CNN设计,有三个重要的想法:

第一、他们减少了运行神经架构搜索的GPU内存负载。一般来说,标准的神经结构搜索可以同时检查网络中神经层之间所有可能的连接。然而,Han的团队每次只在GPU的内存中保存一条路径。这个技巧可以在仅使用十分之一内存空间的情况下,对参数空间进行完整的搜索,从而使他们的搜索覆盖更多的网络配置,而不会耗尽芯片上的空间。

第二、从已丢弃的神经网络搜索中删除整个路径,这明显加快了神经网络搜索的速度。

第三、让神经网络搜索意识到AI系统可能正在运行的硬件的延迟时间——无论是CPU还是GPU加速的移动平台系统。

Han说,令人惊讶的是,关于一些图像识别神经网络的传统观点是错误的。在某种意义上,AI网络设计师在设计主要运行在GPU系统上的网络时,他们的想法仍然停留在CPU时代。

CNN在其图像识别算法中使用过滤器,这些算法是由3×3、5×5或7×7像素组成的正方形网格。一般来说,7x7的过滤器很少见,因为人们认为,运行更多的3x3过滤器比运行单个7x7过滤器更快。

然而,Han说,经过AI优化的AI使用了相当数量的7x7过滤器。他还表示,这是当今大多数AI计算中GPU占主导地位的原因。“目前,我们已经发现GPU上运行7x7更简单,因为GPU有很大的并行度,”Han补充道,“而且调用一个大型内核比调用几个小型内核更有效。”

在谈到他的团队的算法时,Han说:“它为人类工程师未来设计神经网络提供了良好的反馈。”然而,这并不意味着AI能够构建更强大的版本。

雷锋网注:本文作者 Mark Anderson,文章编译自IEEE

雷锋网(公众号:雷锋网)注:【封面图片来源:网站名IEEE,所有者:iStockphoto】

雷锋网版权文章,未经授权禁止转载。详情见转载须知。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
7月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
778 30
|
7月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
1180 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
7月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
775 2
|
7月前
|
人工智能 安全 数据可视化
Dify让你拖拽式搭建企业级AI应用
Dify是开源大模型应用开发平台,融合BaaS与LLMOps理念,通过可视化工作流、低代码编排和企业级监控,支持多模型接入与RAG知识库,助力企业快速构建安全可控的AI应用,实现从原型到生产的高效落地。
Dify让你拖拽式搭建企业级AI应用
|
7月前
|
自然语言处理 数据挖掘 关系型数据库
ADB AI指标分析在广告营销场景的方案及应用
ADB Analytic Agent助力广告营销智能化,融合异动与归因分析,支持自然语言输入、多源数据对接及场景模板化,实现从数据获取到洞察报告的自动化生成,提升分析效率与精度,推动数据驱动决策。
|
7月前
|
人工智能 安全 Serverless
再看 AI 网关:助力 AI 应用创新的关键基础设施
AI 网关作为云产品推出已有半年的时间,这半年的时间里,AI 网关从内核到外在都进行了大量的进化,本文将从 AI 网关的诞生、AI 网关的产品能力、AI 网关的开放生态,以及新推出的 Serverless 版,对其进行一个全面的介绍,期望对正在进行 AI 应用落地的朋友,在 AI 基础设施选型方面提供一些参考。
1356 100
|
7月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
768 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
7月前
|
人工智能 安全 中间件
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,推出AgentScope-Java、AI MQ、Higress网关、Nacos注册中心及可观测体系,全面开源核心技术,构建分布式多Agent架构基座,助力企业级AI应用规模化落地,推动AI原生应用进入新范式。
1092 26
|
7月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
7月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
485 3