要把人工智能提速50倍的ARM,却依然坚持做“通用的计算架构”

简介:

3月21日下午,ARM在北京对外公布了一项新技术——DynamIQ技术,并宣称这个技术将被大量的应用于汽车、家庭以及各种互联设备,设备产生的数据会在云端或者设备端被用于机器学习,以实现更先进的人工智能。

这个技术是ARM公司的一项重大突破。按照ARM自己的说法,“DynamIQ是针对下一个计算时代应运而生的新技术”。之所以这么评价,ARM副总裁暨计算产品事业部总经理Nandan Nayampally作出了解释:

要把人工智能提速50倍的ARM,却依然坚持做通用的计算架构

ARM副总裁暨计算产品事业部总经理Nandan Nayampally

1、这项技术相当于“重新定义了多核处理器”。

说到这里我们先回顾一下12年前,ARM确实在业界推出了革新式的产品多核ARM11,ARM11实际上是第一次实现了在单一群集当中可以支持四个核用于嵌入式的系统。也就是说,即使是一个群集,内部的配置也能够做到多元化、灵活性。

六年前,ARM开始引入大小核群集这样的技术。两个不同的群集连在一起,能够实现异构计算的多核。这就更适用于越来越高需求的智能手机,同时延伸到了企业级计算,甚至汽车等嵌入式系统的领域。

现在,DynamIQ技术所基于的Cortex-A系列处理器,将重新定义多核。这也是ARM big.LITTLE技术(为适当的作业分配恰当的处理器)的重要演进,因为DynamIQ big.LITTLE能够允许对单一计算集群上的大小核进行配置,而这在过去是不可能的。例如,1+3或者1+7的SoC(系统级芯片)设计配置, 现在因为DynamIQ big.LITTLE使其得以实现,这个功能,尤其在异构计算和具有人工智能的设备上都是需要优先考虑的。

Nandan Nayampally说,“有了DynamIQ这个技术,我们在一个群集当中可以最多放8个核,而且这8个核可以是不同处理能力的核。这意味着,不管你有没有大小核,都能够实现同构或者异构计算的灵活性。”“另外,DynamIQ还可以与CoreLink和Cache Coherent Interconnect技术互补,实现与大型计算系统的连接。”“此外, DynamIQ对内存子系统做了重新设计,让核本身具有更强的处理能力和更高的性能。”所有这些性能,以及快速响应,都被延展到片上系统的其他部分。

2、DynamiQ还包含了一系列针对机器学习和人工智能进行优化的全新处理器指令集,可以加速人工智能在各个领域的普及程度。这个“加速”,主要通过对CPU和片上系统两方面性能的提升来实现。第一代采用DynamiQ技术的Cortex-A系列处理器在使用优化指令集后,可以实现比基于Cortex-A73设备高出50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。

3、这项技术拥有高度可拓展性以及量身定制的解决方案。它指的是一个全新的单一群集,在这个单一群集当中最多可以放置八个处理能力,或者功耗不同的核。这也就把芯片级或者是群集的可配置性,推上了一个新的台阶——结合使用CoreLink的话,可以把DynamIQ用于一些大型计算系统。

4、DynamIQ能实现更安全的自动控制系统(safer autonomous system),支持ASIL-D安全标准。不管是因为系统本身,还是因为人为的错误导致了系统故障,DynamIQ的技术能够帮助系统实现自恢复的功能。在这背后,DynamIQ从需求的捕获,到设计、验证、跟踪、部署、交付,整个过程当中都有非常严苛的执行。

值得注意的是,这个技术发布会是ARM在2016年被软银收购后的第二次大动作。而在ARM官方,加入软银集团并不仅仅是一次商业事件,更多的被描述成“为了引领下一次信息革命的突破性转型”。

在这次的技术发布会,ARM还是走这个路数,尽管ARM整场一直强调将在人工智能领域有所突破,但Nandan Nayampally在回答现场媒体提问时表示,ARM依然坚持做通用的计算架构,“重点是发布一个技术的平台”。

“通用的计算架构”一直是ARM的定位。这时候我们就有必要来了解一下这家公司。26年前成立于英国剑桥的ARM,是一家半导体设计及软件公司,公司既不生产芯片也不销售芯片,它只出售芯片知识产权方案授权——“ARM架构”。这个架构被广泛使用在手机、PDA(掌上电脑)、平板、数字媒体、计算器、手游控制台等等当中。

也许你并不了解ARM这家企业,但你很可能是它的用户。简单说,目前你能买到的硬件设备里,不管是骁龙、MTK、苹果还是海思麒麟,这些芯片统统使用过ARM的指令集架构或处理器架构。它们向ARM购买授权之后,在ARM架构的基础上再设计或改进芯片。也正是因为这样,ARM架构的芯片出货量已经达到了1000亿。

而ARM笃定,把这个数字再翻一倍只需要5年——到2021年,ARM的总出货量将达到2000亿片。Nandan Nayampally表示,ARM现有的成绩和对未来的乐观预测,有几个因素:

一方面反映了整个行业目前对于更多计算的需求,一方面因为ARM“全面计算(Total Computing)”自身的高可拓展性,更关键的是基于他们的合作伙伴——目前ARM在全球有450多家半导体行业合作伙伴,有35亿人使用基于ARM架构的计算设备,用来联网、通信以及计算。

特别是现在人工智能和物联网发展的越快,ARM的生态系统越不再局限于移动计算领域。市面上有更多基于ARM的软件、软件堆栈和应用被开发出来,被应用在智能手机以外的智能家居、汽车以及企业级应用。

在这些越来越细分的领域,“基于ARM架构的芯片小到能够用在一个连电池都没有、必须要依赖外部供电的非常微小的传感器当中。甚至注入到人体,可以监测人体的状态——我们相信,ARM架构在物联网的世界当中确实能够作为一个非常有效的催化剂。”Nandan Nayampally说。

这个“催化剂”时间可能不会等太长,或许2020年是一个时间点。Nandan Nayampally设想:2020年,人工智能、机器学习、电脑视觉以及电脑的语言能力会无所不在;

一些智能化被深入的运用到无人驾驶车、机器人以及工业控制系统当中——除了高性能,安全性也格外重要;

而且到了2020年,人类能够真正地实现混合现实。“尽管5G为我们描述了一个极低延时,超高带宽通信的情景,但是数据会以爆炸式的状态去发展。也就意味着,我们需要更高、更强的处理能力,我们不能够完全依赖于云端进行数据处理。此外,我们需要设备本身能够实现更低的功耗,更低的散热,以及更高的性能。”

到那个时候,ARM计划就是,计算在哪,ARM就在哪。







原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。
目录
相关文章
|
4天前
|
数据处理 编译器 数据库
x64 和 arm64 处理器架构的区别
x64 和 arm64 处理器架构的区别
118 0
|
4天前
|
机器学习/深度学习 存储 人工智能
人工智能平台PAI产品使用合集之如何通过通用文本标记解决方案文档与PAI机器学习平台一起使用
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
1天前
|
数据采集 数据挖掘 关系型数据库
Excel计算函数(计算机二级)(1),2024年最新2024Python架构面试指南
Excel计算函数(计算机二级)(1),2024年最新2024Python架构面试指南
|
3天前
|
消息中间件 存储 Apache
MQ产品使用合集之有RocketMQ arm架构的镜像吗
消息队列(MQ)是一种用于异步通信和解耦的应用程序间消息传递的服务,广泛应用于分布式系统中。针对不同的MQ产品,如阿里云的RocketMQ、RabbitMQ等,它们在实现上述场景时可能会有不同的特性和优势,比如RocketMQ强调高吞吐量、低延迟和高可用性,适合大规模分布式系统;而RabbitMQ则以其灵活的路由规则和丰富的协议支持受到青睐。下面是一些常见的消息队列MQ产品的使用场景合集,这些场景涵盖了多种行业和业务需求。
132 1
|
4天前
|
存储 Cloud Native 对象存储
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
AutoMQ[1] 是新一代基于共享存储架构实现的云原生 Kafka。得益于其存算分离的共享存储架构,通过和阿里云合作,深度使用阿里云可靠、先进的云服务如对象存储OSS、块存储 ESSD、弹性伸缩ESS以及抢占式实例实现了相比 Apache Kafka 10倍的成本优势并且提供了自动弹性的能力。
83395 2
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】讨论 LLM 在更广泛的通用人工智能 (AGI) 领域中的作用
【5月更文挑战第5天】【大模型】讨论 LLM 在更广泛的通用人工智能 (AGI) 领域中的作用
|
4天前
|
敏捷开发 数据可视化 物联网
云效产品使用常见问题之用ARM架构的机器意义不知道如何解决
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
4天前
|
存储 机器学习/深度学习 网络协议
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
阿里云企业级ARM计算规格族是阿里云继X86计算、异构计算、弹性裸金屈服务器、超级计算集群之后推出的全新架构云服务器,ARM计算规格族有通用型实例规格族g8y、计算型实例规格族c8y、通用型实例规格族g6r等。下面是阿里云企业级ARM计算规格族特点、适用场景及最新收费标准和活动价格参考。
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
|
4天前
|
机器学习/深度学习 人工智能 自动驾驶
内存计算为边缘人工智能提供动力,并加速制造业效率
内存计算为边缘人工智能提供动力,并加速制造业效率
|
4天前
|
人工智能 安全 芯片
AI日报:扎克伯格瞄准AGI通用人工智能
AI日报:扎克伯格瞄准AGI通用人工智能
39 1