【DVCon-US-2020】加速图像IP功耗分析的方法

简介: 【DVCon-US-2020】加速图像IP功耗分析的方法

论文题目


 Efficient Methods for Display Power Estimation and Visualization


 这是Intel工程师发表在DVCon2020上的论文,讨论了图形IP功耗分析的加速问题。

研究目的


 功耗在图形领域变得越来越重要,在硅前完成准确的平均功耗和峰值功耗尤为重要。在Intel内部,常用的功耗估计办法是跑仿真、根据RTL toggle计算功耗。


 常规的图像IP功耗估算流程如下:


   根据产品性能要求确认IP的工作负载,比如图像分辨率、视频帧率;


   用第1步的参数配置RTL,然后跑仿真,dump fsdb波形及saif文件;(👈这里卡脖子了)


   跑完后,功耗分析工具(PrimeTime PX等)吃fsdb/saif,吐出功耗分析报告。


 对于单帧图像而言,仿真时间几十个小时,采用这种功耗计算方法尚可接受。但对于UHD超高清或8K视频而言及多帧图像的情况,这种估算方法所需的仿真时间动辄十几天甚至几个月,工程师们分析完功耗后做些优化,重新分析又需要重新来一遍,这对项目schedule是很不友好的,是难以接受的。


得想办法加速仿真。




新方法


方法1 Emulation 跑仿真


 找个palladium或zebu等emulation平台来加速仿真,这个方法似乎并不新奇,大多公司都这么干的吧。下图是simulation和emulation跑仿真的flow。


baf8e13efc0e412cba825d7ea2108edc.png



图1 Power Estimation Flow in Simulation

7cc1b97c67df4caca931e36407344a14.png

图2 Power Estimation Flow in Emulation



方法2 SPLIT方法


 这个方法说来也简单,拿server资源换速度。原来跑一次仿真dump一个波形,现在是并行跑多个仿真,dump多个更小的波形,每个小波形开始dump的起始时间前后衔接,最后把多个波形合并到一块。图3、图4是本文提到的SPLIT方法及仿真过程。这个例子中以16ms分4份为例,每个波形dump 4ms,具体操作过程中可以拆分为更多更小的波形。


db924d8a557d4eff814509f5053508c9.png

图3 Split Run method

bfa182d6ea2f474c8f10a8eafe08c868.png


图4 Split Run Simulations


讨论


 emulation加速仿真的方法没得说,挺好。


 这个SPLIT的方法,不能用于随机仿真。非要随机的话,这些并行跑的case必须用相同的seed,生成完全一样的随机配置参数,跑相同的图。问题是,我以为的随机相同,真的相同吗?如非必要,不推荐采用这种方法。




目录
相关文章
|
3月前
|
机器学习/深度学习 编解码 异构计算
ELAN:用于图像超分辨率的高效远程注意力网络
ELAN:用于图像超分辨率的高效远程注意力网络
111 1
|
传感器 机器学习/深度学习 算法
能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高
能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高
111 0
带你读《5G大规模天线增强技术》——2.4.6 大尺度参数计算
带你读《5G大规模天线增强技术》——2.4.6 大尺度参数计算
带你读《5G大规模天线增强技术》——2.4.8 小尺度计算增强(2)
带你读《5G大规模天线增强技术》——2.4.8 小尺度计算增强(2)
带你读《5G大规模天线增强技术》——2.4.8 小尺度计算增强(2)
|
5G 定位技术
带你读《5G大规模天线增强技术》——2.4.9 基于地图的混合信道模型(2)
带你读《5G大规模天线增强技术》——2.4.9 基于地图的混合信道模型(2)
带你读《5G大规模天线增强技术》——2.4.9 基于地图的混合信道模型(2)
带你读《5G大规模天线增强技术》——2.4.4 路径损耗计算
带你读《5G大规模天线增强技术》——2.4.4 路径损耗计算
带你读《5G大规模天线增强技术》——2.4.7 小尺度参数计算
带你读《5G大规模天线增强技术》——2.4.7 小尺度参数计算
|
5G 定位技术 Windows
带你读《5G大规模天线增强技术》——2.4.8 小尺度计算增强(1)
带你读《5G大规模天线增强技术》——2.4.8 小尺度计算增强(1)
|
XML 5G 定位技术
带你读《5G大规模天线增强技术》——2.4.9 基于地图的混合信道模型(1)
带你读《5G大规模天线增强技术》——2.4.9 基于地图的混合信道模型(1)
|
机器学习/深度学习 传感器 算法
单GPU实现20Hz在线决策,最新基于序列生成模型的高效轨迹规划方法解读
单GPU实现20Hz在线决策,最新基于序列生成模型的高效轨迹规划方法解读
134 0