【DVCon-US-2020】基于Signoff Abstract Model的低功耗设计层级验证加速

简介: 【DVCon-US-2020】基于Signoff Abstract Model的低功耗设计层级验证加速

论文概述


本文题目 “Shift left” Hierarchical Low-Power Static Verification Using SAM,作者是AMD和Synopsys的美国、印度工程师。论文可参考 Efficient Hierarchical Verification For 低功耗 Designs,是同一个作者写的,改了改投了DVCon2020。


 本文讲了基于Signoff Abstract Models(SAM)的静态低功耗验证。本论文是软广吧,推广Synopsys工具的。无论如何可以瞧一瞧,指不定哪天会用上呢。




研究目的



随着SoC设计面积、复杂度的快速增长及高级power-aware架构的使用,很有必要及早启动静态低功耗验证(Shift left),以缩减Turnaround time,加速产品上市。因此,设计者们常采用在自底向上的层级验证(hierarchical verification)。


 层级验证中,常用的Flow有Black Box、ETM、Flat run这几种。这几种Flow在运行时间性能和准确性上难以兼得(如图1),Black Box性能最好但准确性最差,Flat run的准确性最高但性能最差。


1eb80c6388624a6fab8eb5a58b763ae3.png


图1 Comparison of hierarchical 低功耗 verification Flows




新方法


方法提出


本文采用了一种新的静态低功耗验证Flow:基于SAM的静态低功耗验证。采用该Flow能够得到跟Flat run一样的准确度,但runtime performance比Flat run更高。


 BBox方法只关注边界,所以准确性不是很好;Flat run的方法为了准确性保留了太多的逻辑门,导致其性能下降;相比之下SAM方法在子模块中保留了足够多的逻辑门来保证top level层级验证的准确性,同时拿掉了跟层级验证无关的部分来提升仿真性能(模块内部由模块级验证来保证,这里只关注top level相关)。


e96daa8884ac4a85a27eb48d01739193.png

图2 Black Box Flow vs SAM Flow



方法实现


采用本文所有的SAM方法进行静态低功耗的层级验证时,需要用低功耗静态checker的工具对block进行提取(比如S的VC LP),然后集成到SoC中。提取过程中,会把block内跟top level层级验证无关的例化模块及net连接剔除掉,把剩余的部分另存到新的HDL文件中。提取完之后,轻量级的block替代原有的block集成到SoC中。图3是采用SAM进行层级验证的Flow。


26ff9a5f0f694844b9cde05aacbbd73c.png


图3 SAM Hierarchical Flow



实验结果


Flat run及SAM方法的仿真时间如下图。可见,参与SAM方法,在保证准确度的同时,获得了3倍多的仿真提速,占用了memory也省了3倍有余。


a9dbab218b6840f1906e343f96128ec7.png


讨论


  看起来挺不错的,准确度跟Flat run相同,省时间省内存。


  不知道这工具贵不贵?


目录
相关文章
|
18天前
|
自然语言处理
LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍
【5月更文挑战第12天】LongRoPE研究突破LLM上下文窗口限制,无需架构变更和复杂微调,实现8倍扩展至2048万个token。该方法利用位置嵌入非均匀性,通过高效搜索和优化初始化,适用于处理长文本任务,对模型性能影响小。但可能需要较多计算资源,且2048万的长度是否足够所有任务尚待探讨。[论文链接](https://arxiv.org/abs/2402.13753)
16 1
|
18天前
|
机器学习/深度学习 搜索推荐 物联网
微软开源创新LoRA组合方法,增强文生图复杂细节控制
微软研究团队推出Multi-LoRA Composition技术,改善文本到图像模型的细节控制。利用低秩适应(LoRA)提升图像生成精度,通过LORA SWITCH和LORA COMPOSITE解决组合复杂图像的挑战。新方法在ComposLoRA平台上测试,性能优于基线,为图像生成和个性化内容创作开辟新途径。尽管有学习曲线和定制需求优化的问题,但该研究仍为领域带来显著进步。
259 3
微软开源创新LoRA组合方法,增强文生图复杂细节控制
|
18天前
|
IDE JavaScript 开发工具
Stage与FA模型应用程序包结构——【坚果派-红目香薰】
Stage与FA模型应用程序包结构——【坚果派-红目香薰】
30 0
|
18天前
|
物联网
ChatGLM2-INT4 + Lora 结构适配和改造
ChatGLM2-INT4 + Lora 结构适配和改造
82 0
|
18天前
|
机器学习/深度学习 Python
网络训练需要的混合类型数据的组织方式
网络训练需要的混合类型数据的组织方式
|
11月前
|
SQL 消息中间件 缓存
12种接口优化的通用方案
12种接口优化的通用方案
157 0
|
11月前
|
存储 算法 芯片
ov2640子设备核心操作详细分析
ov2640子设备核心操作详细分析
192 0
|
机器学习/深度学习 Oracle 算法
利用概率学实现组合优化层,新研究构建Julia开源包InferOpt.jl
利用概率学实现组合优化层,新研究构建Julia开源包InferOpt.jl
|
SQL Java 数据库连接
数据层设计与开发(数据层标准实现类) | 学习笔记
简介:快速学习数据层设计与开发(数据层标准实现类)
127 0
数据层设计与开发(数据层标准实现类) | 学习笔记
|
数据库 开发者
数据层设计与开发(定义数据层标准) | 学习笔记
简介:快速学习数据层设计与开发(定义数据层标准)
161 0
数据层设计与开发(定义数据层标准) | 学习笔记

热门文章

最新文章