【技术综述】层次化的低功耗设计方法

简介: 本文从低功耗设计的必要性、功耗来源和层次化的低功耗设计方法三个方面,概括性的介绍了IC设计中的低功耗技术,由于本文内容主体是对参考文献[1]和[2]的汇总提炼,因此文中对涉及这两篇文献的内容未做引用标注。

1 低功耗设计的必要性

随着十多年前“Dennard Scaling”定律的终结3,晶体管体积缩小带来了功耗密度的增加。因此伴随芯片集成度的提高、门级规模的增大和性能表现的提高,芯片的功率消耗也随之增加,由此功耗优化问题越来越受到开发人员的重视。综合考量,降低芯片功耗的必要性主要体现在以下几个方面:

  • 散热成本:在芯片的工作过程中,电能以热量形式消耗。为保证芯片正常的工作温度,芯片功耗的增加对封装技术和散热方式提出了更高的要求,同时也增加了芯片的散热成本;
  • 体积:功耗增加需要搭配更大的散热设备,从而增大了芯片产品的体积;
  • 电源成本:功耗增加缩短了端侧设备的电池有效供电寿命;
  • 可靠性:功耗增加带来的芯片环境温度提升会降低芯片的可靠性;

2 功耗来源

充分的了解功耗来源,才能从策略上有效的降低功耗。芯片的功耗来源依据晶体管的工作状态分为静态功耗和动态功耗,具体含义如下:

  • 静态功耗:又称“待机功耗”,是指电路在没有信号反转时,晶体管中漏电流造成的功耗;
  • 动态功耗:是电路在工作时(翻转时)所消耗的能量,对于CMOS电路它又分为开关功耗和短路功耗,用公式描述如下:

image.png

在大规模IC设计中动态功耗占主要地位,典型应用中占到总功耗的80%。动态功耗中短路功耗部分的短路时间较短,此部分功耗可以忽略,因此降低动态功耗无非是从降低Vdd、fclock、CL和Ptrans等的角度出发,由此也会引入在不同设计层次上对低功耗设计的考量。

3 层次化的低功耗设计方法

低功耗设计方法涉及系统级、逻辑级和物理级等不同的设计层次,层次越高对功耗降低就可能越有效,下图是在各抽象层次上降低功耗方法的总览图:

image.png

针对每个抽象层次上的部分低功耗设计方法的具体介绍如下:

3.1 系统级低功耗技术

  • 软硬件划分:采用基于高层次建模的方式进行软硬件划分,高抽象级模型有助于合理高效的分配计算任务到软硬件中,从而降低无效的计算消耗;
  • 整合领域专用模块搭建异构计算平台:将通用SOC与领域专用模块融合,实现领域计算任务的高效部署,从而从系统级降低功耗;

3.2 体系结构级低功耗技术

  • 动态电压频率调节:针对运行中的芯片,依据不同的计算场景动态调整芯片的供电电压和工作频率,实现计算性能和功耗之间的平衡;
  • 多电压供电:对不同模块根据其性能要求不同采用不同电源供电,设计需要在模块间额外增加power rails和level shifters;
  • 门控电源:最常用的体系结构级低功耗技术之一,依据门控层次分为细粒度电源门控和粗粒度电源门控,后续将会有博文针对此项技术展开详细介绍;
  • 门控时钟:是在寄存器不工作时(即使能信号无效时),使能时钟无效,从而时钟树上对应buffer及register都不会再有动态功耗;

3.3 寄存器传输级低功耗技术

此层次上核心降低功耗的思路是通过逻辑优化,减少信号跳变次数,典型应用场景如下:

  • 总线反转:在当前数据与下一个数据之间的汉明距离大于N/2(N为总线位宽)时,就将下一个数据反向后传播,以减少总线上出现转换的位的数量;
  • 状态机编码风格:采用独热码而非二进制码来编码状态机的状态,从而简化译码逻辑,进而减少信号跳变次数;
  • 去掉逻辑云:在操作大规模逻辑云(包括宽加法器、乘法器等)时,往往会在需要时才将其打开;

3.4 晶体管级低功耗技术

  • 调整衬底偏置:降低MOS管衬底偏置可以提高动态电流从而提高电路工作速度,但是衬底偏置和静态漏电成指数反比关系,因此衬底偏置的调整既是对速度和功耗之间的权衡,又是对动态功耗与静态功耗之间的权衡;

4 参考资料

[1]. Arora, Mohit . The Art of Hardware Architecture[M]. Springer New York, 2012.
[2]. Keating M, Aitken R, Flynn D, et al. Low Power Methodology Manual: For System-on-Chip Design[J]. 2007.
[3]. Hennessy J,Patterson D. Computer Architecture-A Quantitative Approach-Sixth Edition[M]. Morgan Kaufmann Publishers Inc. 2018.
[4]. Patterson D . 50 Years of computer architecture: From the mainframe CPU to the domain-specific tpu and the open RISC-V instruction set[C]// Solid-state Circuits Conference. IEEE, 2018.

原文作者:朴凡
点击查看原文

相关文章
|
5月前
|
传感器 人工智能 物联网
HarmonyOS NEXT~鸿蒙操作系统功耗优化特性深度解析
本文深入解析了华为鸿蒙(HarmonyOS)操作系统的功耗优化特性,涵盖低功耗设计原理、核心技术及实际应用效果。通过与Android对比,展现其在待机功耗、CPU调度效率和内存占用上的优势。文章重点阐述分布式任务调度、微内核架构及智能感知技术,并针对智能穿戴、物联网和智能手机等场景优化进行分析,同时为开发者提供优化建议。未来,鸿蒙将探索AI预测性管理等新技术,进一步提升能效表现。
597 30
|
前端开发 算法 Unix
面向前端设计的DFT基础介绍(一)——MBIST存储器内建自测试
本文介绍了MBIST存储器内建自测试的中,MBIST的特点,如何测试,Tessent加入的测试逻辑的结构等基础知识,继而以几个实例的图示和解读,描述了RTL设计满足MBIST设计的前置需求。
43562 3
面向前端设计的DFT基础介绍(一)——MBIST存储器内建自测试
|
9月前
|
人工智能 语音技术 iOS开发
MiniCPM-o 2.6:面壁智能开源多模态大模型,仅8B参数量就能媲美GPT-4o,支持实时交互,在ipad等终端设备上运行
MiniCPM-o 2.6 是面壁智能开源的多模态大模型,支持视觉、语音和多模态直播,性能媲美GPT-4o,能够在端侧设备上高效运行。
694 10
MiniCPM-o 2.6:面壁智能开源多模态大模型,仅8B参数量就能媲美GPT-4o,支持实时交互,在ipad等终端设备上运行
|
资源调度 芯片
流片Corner Wafer介绍
芯片制造是一个物理过程,存在着工艺偏差(包括掺杂浓度、扩散深度、刻蚀程度等),导致不同批次之间,同一批次不同晶圆之间,同一晶圆不同芯片之间情况都是不相同的。
22521 0
流片Corner Wafer介绍
|
Java 编译器
什么是双亲委派机制?
什么是双亲委派机制?
405 59
|
存储 机器学习/深度学习 人工智能
冲破冯诺伊曼瓶颈:探索存内计算与静态随机存储器(SRAM)性能因素
冲破冯诺伊曼瓶颈:探索存内计算与静态随机存储器(SRAM)性能因素
1627 6
|
存储 传感器 数据可视化
3D目标检测数据集 KITTI(标签格式解析、3D框可视化、点云转图像、BEV鸟瞰图)
本文介绍在3D目标检测中,理解和使用KITTI 数据集,包括KITTI 的基本情况、下载数据集、标签格式解析、3D框可视化、点云转图像、画BEV鸟瞰图等,并配有实现代码。
3555 1
|
监控 安全 网络安全
如何保护 Apache 服务器的安全
【8月更文挑战第23天】
280 0
|
人工智能 安全 定位技术
IT风险管理:识别、评估与缓解的艺术
【6月更文挑战第22天】面对数字化时代的挑战,企业需精通识别、评估与缓解IT风险以保障数字资产安全。本文聚焦风险识别的关键性,使用头脑风暴等工具发现潜在风险;通过概率-影响矩阵等评估风险严重性;并采取加强安全防护、完善制度等措施缓解风险,确保企业稳定运营。持续提升风险管理能力至关重要。
|
Java 测试技术 持续交付
自动化测试框架选型与实战:深入探索与应用
【5月更文挑战第8天】本文探讨了自动化测试框架的选型与实战应用,强调了其在软件质量保障中的重要性。选型原则包括考虑项目需求、技术栈、可扩展性和可维护性,以及社区支持和文档。介绍了Selenium、Appium、JUnit和Pytest等常用框架,并概述了实战应用的步骤,包括明确需求、搭建环境、编写测试用例、执行测试、分析结果、维护代码和持续集成。合理选型与实践能提升测试效率,保障项目成功。