AI原生芯片

简介: 我们都知道,全球芯片制造企业中,制程工艺最先进的,就是台积电。过去几年,台积电最大的客户就是苹果,占到了年度营收的20%以上。

我们都知道,全球芯片制造企业中,制程工艺最先进的,就是台积电。过去几年,台积电最大的客户就是苹果,占到了年度营收的20%以上。

 

既是自己的第一大客户,而这个客户还非常愿意尝试最新的制程工艺;因此,当台积电量产10纳米、7纳米、5纳米的时候,苹果始终都是最早尝鲜的那个。

微信图片_20211224143318.jpg

如今,这个“国际惯例”似乎要被打破了。据外电报道,台积电3纳米或将于明年7月量产,而率先引入的客户会有两家,一家是英特尔,另一家则是Graphcore。

 

英特尔咱们以后再说,先说这家Graphcore,其实是一家成立仅仅6年时间的英国公司。也是在今年,这家公司获得了E轮融资,估值高达27.7亿美元,也是西方国家里唯一的半导体行业“独角兽”(估值超过10亿美元的未上市公司)。


微信图片_20211224151143.jpg


那么,为什么Graphcore这么值钱?老冀仔细琢磨了一下,想出了一个理由:因为Graphcore是一家“AI原生”的芯片设计公司,只有它设计的IPU(Intelligence Processing Unit),从一开始就是为了AI(人工智能)而生的。

 

说到AI,大家应该也能够感觉到,经历了数字化浪潮之后的我们,即将进入智能化时代。未来,越来越多的企业、消费者、地方、场景都会用到AI。最近老冀就看到了一个新闻,全球领先的新能源电池生产商宁德时代,就与AI公司第四范式达成战略合作,要让AI系统与现有生产系统对接,实现对生产线数据的实时分析与决策。

 

AI应用的过程一般可以分为训练和推理,哪个阶段都离不开强大算力也就是芯片的支持。以AI训练为例,要满足其不断增长的需求,一方面需要不断提升芯片的计算能力,另一方面可能大家就知道得比较少了,那就是还需要不断提升存储容量和带宽,这是因为在AI训练的过程中需要存储大量的中间激励函数。


微信图片_20211224151309.jpg


可是,目前用于AI训练的主流芯片——GPU,当初是为了大规模并行计算而开发的,那个时候还没有大规模AI计算的需求,这也导致其在做AI训练的时候存在短板。

 

其中一个比较大的短板,就是“存储墙”。简单来说,无论是CPU还是GPU,它的计算单元与大部分的存储单元是分开的,而要完成一个复杂的AI训练,就需要在计算单元和存储单元之间频繁地、大批量地传输数据。可是,最近这些年数据传输的提升速度,远远赶不上计算能力的提升速度,这就导致AI训练卡在了这个瓶颈上。


微信图片_20211224151328.jpg


Graphcore想出了办法解决这个瓶颈,它设计的第一代IPU拥有高达1216个核,每个核里都集成了计算单元和内存,使得单个IPU的存储带宽达到了45TB,比性能最快的HBM还提升了50倍以上。而且,由于避免了频繁访问外部存储,在相同算力下,IPU的功耗还降低了一半。


微信图片_20211224151347.jpg


正因为IPU解决了AI计算的痛点,2019 年,Graphcore的IPU一经推出,立即获得了微软、戴尔、Uber、DeepMind(曾经发布过击败人类所有围棋大师的AlphaGo的那家大神级AI公司,如今已经归于Google旗下)等科技巨头的青睐,因为它打破了AI处理能力的瓶颈。

 

老冀看到微软公司研究员Sujeeth Bharadwaj曾经表示,微软曾经用AI来读取X光胸片并诊断肺部病症。一开始AI训练用的是最高端的GPU,结果花了5个小时;改用Graphcore的IPU之后,只用了半个小时就搞定。

 

不过,鉴于IPU要集成这么多的核,还要把计算单元和内存“攒”在一起,这就导致了非常复杂的芯片内部结构,也让IPU成为了当前最复杂的处理器芯片。2020年7月,Graphcore发布了第二代IPU GC200,它采用了台积电7纳米工艺,晶体管数量高达594亿个,比两个月前NVIDIA发布的安培架构GPU A100的晶体管数量还要多出10%。


微信图片_20211224151408.jpg


这么复杂的芯片,当然是制程工艺越先进,越能够缩小裸片面积,越能够降低功耗。因此,虽然台积电最先进的3纳米工艺还没有量产,Graphcore却已经急吼吼地找上门来。对于台积电来说,也是非常乐于接受像Graphcore这样的新鲜客户,一来能够帮助检验制造工艺的可靠性,二来说不定将来Graphcore能够长成像苹果、AMD、高通那样的大客户呢?


微信图片_20211224151428.jpg


不过,如果IPU能够在AI领域成为主流的话,GPU的地位就将动摇,这也许会影响到GPU老大NVIDIA的江湖地位。要知道,正是因为赶上了AI的风口,NVIDIA的市值才得以超越领跑几十年的英特尔,成为芯片行业新的领袖。

 

要知道,Graphcore与NVIDIA还有一笔旧账要算,它的两位创始人 Nigel Toon 和 Simon Knowles曾经创办过一家名为Icera的芯片公司,并在2011年被NVIDIA收购。他们两人从NVIDIA离职之后,才在2016年创办了Graphcore。由于在NVIDIA工作过一段时间,他们对于GPU在AI计算中的优点和缺点都门清。

 

Graphcore的早期投资人同时也是ARM公司的联合创始人Hermann Hauser曾经有过一个著名的论断:在计算机的计算架构上,历史上一共只发生了三次革命,第一次革命上个世纪 70 年代的 CPU,第二次革命上个世纪 90 年代的 GPU,第三次革命则是2019年横空出世的IPU。他的论断会成为现实吗?

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
8月前
|
人工智能 数据可视化 定位技术
不会编程也能体验的 AI 魔法,外滩大会代码原生地等你解锁
不会编程也能体验的 AI 魔法,外滩大会代码原生地等你解锁
564 39
|
8月前
|
人工智能 运维 监控
让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动
本次大赛由阿里云主办,云原生应用平台承办,聚焦 Operation Intelligence 的智能运维(AIOps)赛道,为热爱 AI 技术的开发者提供发挥创意和想象力的舞台,借助 LLM 强大的推理能力与标准化整合的多源可观测数据,找到 AI 应用在智能运维(AIOps)场景上的新方式。
852 31
人工智能 关系型数据库 分布式数据库
495 19
|
9月前
|
人工智能 Cloud Native Java
书本大纲:从芯片、分布式到云计算AI时代
本文深入探讨并发编程、JVM原理、RPC框架、高并发系统、分布式架构及云原生技术,涵盖内存模型、同步机制、垃圾回收、网络协议、存储优化、弹性伸缩等核心议题,揭示多线程运行逻辑与高并发实现路径,助你掌握现代软件底层原理与工程实践。
267 7
|
开发框架 人工智能 Java
破茧成蝶:阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代
本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分:第一部分阐述了传统J2EE应用在智能化转型中的痛点,如协议鸿沟、资源冲突和观测失明;第二部分展示了阿里云应用服务器的解决方案,包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性;第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程,确保十年代码无需重写,轻松实现智能化跃迁。
878 42
|
存储 人工智能 运维
MoE大模型迎来“原生战友”:昇腾超节点重构AI基础设施
大模型训练中,MoE架构逐渐成为主流,但也面临资源利用率低、系统稳定性差、通信带宽瓶颈三大挑战。传统AI集群难以满足其需求,而“昇腾超节点”通过自研高速互联协议、软硬件协同调度、全局内存统一编址及系统稳定性提升等创新,实现384张卡协同工作,大幅提升训练效率与推理性能。相比传统方案,昇腾超节点将训练效率提升3倍,推理吞吐提升6倍,助力MoE模型在工业、能源等领域的规模化应用。5月19日的鲲鹏昇腾创享周直播将深度解析相关技术细节。
721 15
|
开发框架 人工智能 Java
破茧成蝶:传统J2EE应用无缝升级AI原生
本文探讨了技术挑战和解决方案,还提供了具体的实施步骤,旨在帮助企业顺利实现从传统应用到智能应用的过渡。
破茧成蝶:传统J2EE应用无缝升级AI原生
|
8月前
|
设计模式 机器学习/深度学习 人工智能
AI-Native (AI原生)图解+秒懂: 什么是 AI-Native 应用(AI原生应用)?如何设计一个 AI原生应用?
AI-Native (AI原生)图解+秒懂: 什么是 AI-Native 应用(AI原生应用)?如何设计一个 AI原生应用?
|
9月前
|
人工智能
拥抱AI原生!8月29日深圳,企业实践工作坊火热报名中
阿里云诚挚邀请您参加【AI原生,智构未来——AI原生架构与企业实践】工作坊,8月29日13:30于深圳·LandMarkCoffee 蓝马咖啡(南山区科技园桑达科技大厦1楼)从开发范式到工程化实践,全链路解析AI原生架构奥秘,与AI先行者共探增长新机遇。立即报名:https://hd.aliyun.com/form/6638
469 16
拥抱AI原生!8月29日深圳,企业实践工作坊火热报名中
|
8月前
|
人工智能 Cloud Native 中间件
划重点|云栖大会「AI 原生应用架构论坛」看点梳理
本场论坛将系统性阐述 AI 原生应用架构的新范式、演进趋势与技术突破,并分享来自真实生产环境下的一线实践经验与思考。