新一轮科技革命吹响号角,Chiplet或成AI芯片关键“破局”点

简介: Chiplet是平衡性能与成本的“灵丹妙药”

科技云报道原创。

每一次科技创新的浪潮都是通过突破某一项先进生产力要素,从而提升人类生产效率所实现。

image.png

回望前三次科技革命的步伐,不难发现,一项先进生产力从萌芽到被广泛使用,其核心在于能否变革人类的生产生活方式,带来生产效率大幅提升。

3月2日,国务院副总理刘鹤在北京调研集成电路企业发展并主持召开座谈会。刘鹤指出,我国已形成较完整的集成电路产业链,在局部已形成了很强的能力。发展集成电路产业必须发挥新型举国体制优势,尤其是我国拥有庞大的芯片消费市场和丰富的应用场景,这是市场经济下最宝贵的资源,是推动集成电路产业发展的战略性优势。

Chiplet是平衡性能与成本的“灵丹妙药”

当前,摩尔定律逐步趋近于物理极限,新工艺制程发展虽然使得芯片的体积与性能不断迭代,但同时也带来了高昂的成本。

据IBS统计,28nm芯片的设计成本在4000万美元,16nm芯片设计成本约1亿美元,而5nm芯片的设计成本更高达5.4亿美元。

再继续发展下去,先进工艺的投入产出比已难以具备商业合理性,同时受制于光刻尺寸及晶圆厂良率,单芯片的面积也很难继续延伸,未来芯片设计的成本将直接“劝退”中小厂商,甚至大厂也需要摸一下自己的口袋。

而Chiplet的出现则是给了整个行业一个新的思路,Chiplet技术可以将大型7nm设计的成本降低25%,5nm及以下的制程节省的成本更多,基于Chiplet架构的芯片设计理念也逐步成为后摩尔时代提升芯片性能及算力的共识。

简单来说,Chiplet技术就是对原本复杂的SoC芯片的解构,将满足特定功能的裸片通过Die-to-Die内部互连技术与底层基础芯片封装组合在一起,类似于搭建乐高积木一般,最后集成为一个系统级芯片,如采用28nm的芯片,通过Chiplet的方式,便可使其性能和功能接近16nm甚至7nm工艺的芯片。

这样可以通过对不同功能模块的芯片选用合适的制程工艺,从技术方面实现各功能的最优化、成本的最小化、性价比的最大化、模块复用的灵活化。

image.png

来源:SiP与先进封装技术

随着 Chiplet小芯片技术的发展以及国产化替代进程的加速,在先进制程受到国外限制情况下,Chiplet为国产市场开辟了新思路,有望成为我国集成电路产业逆境中的突破口之一。

根据Gartner预测,基于Chiplet方案的半导体器件收入将在2024年达到505亿美元左右,2020-2024年间复合增速达98%。

近年来,国外厂商基于Chiplet技术在各领域都有所尝试,利用Chiplet技术在自身CPU、GPU等通用芯片上的应用已逐步商业化,可以将多颗不同工艺、不同功能的小芯片,通过2D、2.5D、3D等各种方式整合在一起,更灵活地制造大型芯片,当前AMD推出的锐龙、霄龙处理器,英特尔最新的酷睿、至强处理器,都是典型的小芯片架构,而苹果M2 Max芯片通过“简单”的拼接,更加充分地展示出Chiplet在封装互连技术、半导体制造和电路设计上的巨大想象空间。

放眼国内,在先进制程受到国外限制情况下,国产化替代进程逐渐加速,Chiplet也为国内厂商和市场开辟了新思路,是仅有的几种可满足国内日益增长的大算力需求的方式之一,有望成为我国集成电路产业在逆境中的突破口。

同时,面对碎片化且预算有限的算力芯片需求,Chiplet可快速部署高性价比的工程化方案。

全球各大科技巨头布局Chiplet工艺

以ChatGPT为代表的的AI应用蓬勃发展,对上游AI芯片算力提出了更高的要求,头部厂商通过不断提升制程工艺和扩大芯片面积推出更高算力的芯片产品。

2022年,英伟达发布H100采用4nm工艺达到INT8算力1513 TOPS。

然而伴随摩尔定律逼近物理极限,制程升级和芯片面积扩大带来的收益边际递减,架构创新或将成为提升芯片算力另辟蹊径的选择。

2022年8月,国产厂商壁仞科技发布BR100 GPU,采用7nm制程+Chiplet技术,实现了高达2048 TOPS算力,创下全球GPU算力新纪录。
image.png

来源:壁仞科技

研究显示,当5nm芯片的面积达到200mm2以上,采用5 Chiplets方案成本就将低于单颗SoC,并将大幅降低面积增加带来的良率损失。

台积电为Chiplet工艺的领军者,在其3DFabricTM技术平台下有CoWoS、InFO、SoIC三种封装工艺。

其中,CoWoS工艺早在2016年就在英伟达Tesla P100 AI数据中心GPU上得到应用,而AMD的最新GPU、CPU亦广泛采用了该工艺。

除台积电以外,三星、Intel等龙头厂商亦各自推出了自己用于Chiplet的封装技术,如三星I-Cube(2.5D封装),X-Cube(3D封装),英特尔EMIB(2.5D封装),英特尔Foveros(3D封装)。

此外,除了成本和良率端的优势,Chiplet技术带来高速的Die to Die互连,使得芯片设计厂商得以将多颗计算芯粒集成在一颗芯片中,以实现算力的大幅提升。

苹果M1 Ultra用了台积电InFO_LSI工艺,将两颗M1 Max进行拼接,大幅提升整体性能。

前述的BR100则是采用台积电CoWoS-S,将两颗计算芯粒进行并联以实现算力提升。

中国版Chiplet技术标准亟待制定

作为一种互连技术,Chiplet与其他很多技术类似,标准的制定对整个产业来说意义重大。

就像乐高积木之所以能够在全球风靡,其中的一个重要原因就在于其积模件的标准化。

对于Chiplet来说,能否进一步向前发展,很大程度上取决于能否出现一种将不同芯片模型连接起来的标准接口。

对于我国的芯片产业来说,积极拥抱国际标准是一个必选项,定制我国自己的Chiplet标准更是迫在眉睫。

时间退回到2020年8月,中科院计算所牵头成立了中国计算机互连技术联盟,重点围绕Chiplet小芯片和微电子芯片光I/O(输入/输出)成立了两个标准工作组,就前者而言,CCITA于2021年5月在工信部立项了Chiplet标准,即《小芯片接口总线技术要求》,由中科院计算所、工信部电子四院和国内多个芯片厂商合作展开标准制定工作。

小芯片接口标准制定集结了国内产业链上下游60多家单位共同参与研究。

在去年12月16日举办的“第二届中国互连技术与产业大会”上,首个由中国集成电路领域相关企业和专家共同主导制定的《小芯片接口总线技术要求》团体标准,正式通过工信部中国电子工业标准化技术协会的审定并发布。

这是中国首个原生Chiplet技术标准,对于中国集成电路产业延续“摩尔定律”,突破先进制程工艺限制具有重要意义。

这项标准描述了CPU、GPU、人工智能芯片、网络处理器和网络交换芯片等应用场景的小芯片接口总线(Chiplet)技术要求,包括总体概述、接口要求、链路层、适配层、物理层和封装要求等,以灵活应对不同的应用场景、适配不同能力的技术供应商,通过对链路层、适配层、物理层的详细定义,实现小芯片之间的互连互通,兼顾了PCIe等现有协议的支持,并列出了对封装方式的要求。

截至目前,基于Chiplet架构进行芯片设计,但由于技术门槛较高,如果只靠自身完成全部设计,需要芯片厂商具备从芯片整体的架构设计到其中并行或者串行物理层接口,甚至先进封装的能力,当下只有Intel公司能做到;因此,在我国首先需形成完整的、面向Chiplet架构设计芯片的社会分工,在此基础上,形成Chiplet标准则更加重要。

在芯片工艺被国外“卡脖子”的情况下,很多人都认为Chiplet是我国在芯片领域弯道超车的一个机会。

但不要忘了,在实际驾驶的过程中,弯道超车是要尽力避免的操作,在直线上加速超车才是正确的行为。

芯片产业的积累也不是短时间可以完成的,也不是靠抄近道、投机取巧可以实现的。

而国内厂商要走“全自研”路线,仍需打磨很长时间。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
21天前
|
存储 人工智能 运维
AI导购革命:揭秘主动式智能导购AI助手的构建之道
本文基于《主动式智能导购AI助手构建》解决方案的实际部署体验,从引导与文档帮助、解决方案原理与架构理解、百炼大模型及函数计算应用明晰度、生产环境步骤指导四个方面进行了详细评估。指出尽管该方案具有创新性和实用性,但在文档详尽性、技术细节解释及生产环境适应性等方面仍有待提升。通过进一步优化,可增强解决方案的可用性和用户满意度。
88 31
|
9天前
|
人工智能 自动驾驶 安全
“第四次工业革命”-AI革命
“AI变革”被誉为“第四次工业革命”。中国在AI领域持续发力,占亚太地区AI支出的五成,预计2023年市场规模将达到147.5亿美元,约占全球市场的十分之一。IDC预测,中国生成式AI市场年复合增长率将达86.2%。国内企业如百度、阿里、清华等在AI技术研发和应用方面取得显著进展,推动了无人驾驶、送餐机器人、无人快递车等应用场景的发展。尽管AI带来了降本增效,但也引发了就业和社会压力。总体而言,中国在AI领域的投入和发展势头强劲,未来前景广阔。
43 0
“第四次工业革命”-AI革命
|
26天前
|
人工智能 并行计算 程序员
【AI系统】SIMD & SIMT 与芯片架构
本文深入解析了SIMD(单指令多数据)与SIMT(单指令多线程)的计算本质及其在AI芯片中的应用,特别是NVIDIA CUDA如何实现这两种计算模式。SIMD通过单指令对多个数据进行操作,提高数据并行处理能力;而SIMT则在GPU上实现了多线程并行,每个线程独立执行相同指令,增强了灵活性和性能。文章详细探讨了两者的硬件结构、编程模型及硬件执行模型的区别与联系,为理解现代AI计算架构提供了理论基础。
64 12
|
17天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。
|
20天前
|
人工智能 自然语言处理 搜索推荐
AI 赋能:开启内容生产效率革命的密钥》
在数字化时代,AI技术正成为提高内容生产效率的关键工具。本文探讨了AI在文章写作、文案创作、翻译、图像识别与生成及数据分析等方面的应用,分析了其提高效率的方式、带来的优势与挑战,并通过新闻媒体、营销、教育等行业案例,展望了AI在内容生产领域的未来。
|
23天前
|
人工智能 数据安全/隐私保护 数据中心
“芯片围城”下国产AI要放缓?答案或截然相反
12月2日,美国对华实施新一轮出口限制,将140余家中国企业列入贸易限制清单。对此,中国多个行业协会呼吁国内企业谨慎选择美国芯片。尽管受限企业表示影响有限,但此事件引发了关于AI领域芯片供应的担忧。华为云推出的昇腾AI云服务,提供全栈自主的算力解决方案,包括大规模算力集群、AI框架等,旨在应对AI算力需求,确保算力供给的稳定性和安全性,助力中国AI产业持续发展。
|
1月前
|
机器学习/深度学习 人工智能 算法
【AI系统】AI芯片驱动智能革命
本课程深入解析AI模型设计演进,探讨AI算法如何影响AI芯片设计,涵盖CPU、GPU、FPGA、ASIC等主流AI芯片,旨在全面理解AI系统体系,适应后摩尔定律时代的技术挑战。
45 5
|
1月前
|
机器学习/深度学习 人工智能 运维
智能运维:AI驱动的IT运维革命###
【10月更文挑战第21天】 随着数字化转型的深入,智能运维(AIOps)正逐步成为企业IT管理的核心。本文将探讨AI技术如何赋能运维领域,通过自动化、智能化手段提升系统稳定性和效率,降低运营成本,并分享实施智能运维的最佳实践与挑战应对策略。 ###
100 1
|
1月前
|
人工智能 Cloud Native 算法
|
1月前
|
人工智能 算法 新制造
走进北京科技大学,通义灵码与企业高校共筑 AI 创意课堂
近日,通义灵码有幸参与到一场由伊利集团主办的 AIGC 生态创新大赛路演舞台,与高校专家、企业代表、青年学子共同探讨 AIGC 创意应用,交流企业在数智领域转型、青年开发者科技创新的思路和落地实践。