一、什么是Multi-Die芯片及其设计趋势
定义:Multi-Die(多芯片/芯粒)系统是指在单个封装内集成多个同构或异构裸片的半导体器件。
核心推动力:
分解:将大型单片SoC分解为多个小裸片,突破半导体制造设备的极限尺寸,利用小裸片良率更高的特性提升经济性。
聚合:将原本在PCB上的分立芯片集成到单封装中,Die-to-Die通信比PCB级Chip-to-Chip通信功耗更低、带宽更高。
二、Multi-Die数字设计面临的核心挑战
相较于传统单片SoC,Multi-Die设计需应对多维度的系统性挑战:
系统路径规划:必须在项目早期(RTL可用前6-12个月)确立正确的架构,后期调整架构是产品延期与成本增加的最大元凶。
功耗与热管理:虽然整体PCB信号减少降低了系统功耗,但单位面积功耗增加,热管理成为难题。
验证复杂性:需在系统级进行组装验证,面临容量性能瓶颈、多裸片名称冲突、跨时钟域(CDC)与跨复位域(RDC)复杂性及功耗意图验证困难。
测试与可靠性:传统探针方法不足,需解决裸片级(预键合)、互连级(键合中/后)及封装级的全周期测试、诊断与修复问题。
三、Multi-Die数字设计全流程关键环节与解决方案
- 早期架构探索与可执行规范构建
目标:在早期进行宏观架构决策,包括工作负载分配、内存大小配置、互连协议选择及Die-to-Die接口(如UCIe)的定位。
方法:建立虚拟原型环境,将应用的处理和通信要求(工作负载模型)映射到硬件架构模型,构建可执行规范。
优势:模型高度可配置,仿真速度比RTL快10,000倍,支持并行探索设计空间以优化性能与功耗KPI。
关键决策 - UCIe接口:业界已就UCIe标准达成一致,支持Streaming、AXI/CXS.B、PCIe/CXL等多种协议,适用于优化延迟或无缝聚合分立裸片。
工具参考:Platform Architect™ for Multi-Die,支持基于模型的动态架构探索。
- 系统级功能验证与静态签核
组装与仿真挑战:简单编译多个裸片RTL会导致名称冲突;需解决独立测试平台的复用与同步、分布式仿真及内存容量问题。
解决方案:
单次可执行与分布式仿真:将每个裸片编译到单独库中避免名称冲突,顶层配置文件描述裸片组合,支持同步执行独立测试平台。
静态验证:使用VC LP™结合预定义功耗模式验证功耗意图;使用SpyGlass®处理CDC/RDC检查(需考虑TSV延迟或假设裸片时钟异步)。
接口验证:利用UCIe IP与验证IP(VIP)确保Die-to-Die互连功能正确。
工具参考:VCS®功能验证、ZeBu® Server 5硬件加速系统(支持超大规模复杂系统仿真)。
- 物理实现与裸片/封装协同设计
挑战:涉及硅通孔(TSV)、中介层、细间距凸点等先进封装技术,需依赖尖端EDA工具进行多物理场分析与优化。
解决方案:采用统一的探索到签核平台,整合架构规划、实现、系统分析、验证和签核,支持UCIe、HBM3 IP的自动布线,大幅缩短实施时间。
工具参考:3DIC Compiler™。
- 制造测试、诊断与全生命周期管理
挑战:单芯片故障或互连问题可能危及整个系统,需从生产到现场运行全程监控。
解决方案:
分层DFT架构:遵循IEEE 1838等标准,采用分层SHS结构、主要/次要测试访问端口(PTAP/STAP)、裸片封装寄存器(DWR)及灵活并行端口(FPP),实现Die-to-Die测试访问。
互连修复与监控:采用LTR方法为大容量通道提供内置自测(BIST),支持冗余通道重配与修复;结合UCIe MTR IP、ext-RAM等实现全周期校准与根本原因追溯。
预测性维护:监控PVT(工艺、电压、温度)、老化与退化等关键参数,实现从设计到现场的硅生命周期管理(SLM)。
工具参考:STAR Memory System (SMS)、Synopsys全面的Test与SLM解决方案。
四、总结
Multi-Die芯片的数字设计是从架构探索到制造可靠性的系统工程。其成功关键在于“左移”——即在项目最早期建立可执行规范以规避架构风险,并依托涵盖UCIe互连、统一物理实现、分层测试修复及系统级验证的全流程EDA/IP解决方案,方能实现高I/O密度、灵活组合与加速上市的综合效益。