南京观海微电子---如何减少时序报告中的逻辑延迟

简介: 本文介绍FPGA设计中影响性能的关键因素,包括时钟偏移、逻辑延迟和路径延迟,并结合Vivado时序报告分析违例原因。重点探讨降低逻辑延迟的优化方法:针对CLB器件路径,通过重定时、合并级联LUT、调整CARRY链;对含DSP、RAM等宏原语的路径,建议增加流水级、减少逻辑层级,并合理使用内置寄存器评估时序改善效果。

1. 引言

在FPGA逻辑电路设计中,FPGA设计能达到的最高性能往往由以下因素决定:

工作时钟偏移和时钟不确定性;

逻辑延迟:在一个时钟周期内信号经过的逻辑量;

网络或路径延迟:Vivado布局布线后引入的延迟量。

Vivado软件完成布局布线后,我们可以打开时序分析报告,来查看时序没有过的路径是由哪些因素导致的时序违规。Vivado会通过列表形式展示每条时序违规路径的信息,如下图所示。

双击上面表中的其中一条路径,会展开关于该路径更详细的时序报告,如下图:

上图这个时序违例的例子,可以看到,该路径逻辑延迟贡献了11.934%的延迟量、路径延迟贡献了88.066%延迟量。该路径逻辑级数为5,经过了2个CARRY4、1个LUT4和2个LUT6。

2. 降低逻辑延迟的方法

如果逻辑延迟大,我们需要查看该路径是不是只包含CLB器件,还是说该路径还经过了如DSP、RAMB、URAM、FIFO或GT等器件。

2.1 路径只包含CLB器件

常规布线路径是在寄存器(FD*)或移位寄存器(SRL*)之间的路径,它们经过一些 LUT、MUXF 和 CARRY 元件。通常会遇到以下几种情形导致逻辑延迟过大:

(1)较高逻辑层数(logic levels)的组合电路。用户在两个寄存器之间插入的组合逻辑过于复杂,级联了过多的LUT、CARRY等元件,导致逻辑延迟过高时序过不了。如下图中,两个寄存器之间有一个logic levels为5层的组合逻辑。

建议的解决方案:在设计的早期阶段,通过TCL命令“report_qor_assessment”,早些识别出逻辑层数较高组合逻辑,通过代码优化手段来降低逻辑层次。或者,在综合的时候,将“-retiming”全局变量勾选上。

(2)路径上有很多小的级联LUT(LUT1-LUT4)。这些多个小的级联查找表是可以被合并成数量更少的LUT的。阻止这些级联LUT合并的原因可能如下:

  • 有些小的LUT表存在一些扇出(扇出为10,或者更高);
  • 用户使用了一些properties语法,比如:KEEP、KEEP_HIERARCHY、DON’T_TOUCH或MARK_DEBUG。

建议的解决方案:移除掉这些properties语法,重新编译综合工程。

(3)路径上有单个CARRY(非级联)限制了LUT的优化,导致vivado布局也不是最优。

建议的解决方案:在综合的时候,使用“FewerCarryChains”综合指令。或者对该CELL在opt_design阶段设置CARRY_REMAP属性。(具体使用方法可以查看UG904)

2.2 路径包含其他复杂器件(DSP、RAM等)

如果时序路径上会经过宏原语元件(macro primitives)如DSP、RAM、URAM、FIFO或GT_CHANNEL等元件,布局布线的难度会加大,也会导致更高的布局布线延迟。降低这些路径的逻辑延迟方法如下:

(1)在进出宏原语元件电路周围,增加额外的流水结构。比如:

  • 原设计是用的一个大位宽RAM缓存数据,把这个大位宽RAM拆分成多个并行的小位宽RAM实现相同的功能。
  • 原设计乘法器为2级流水乘法器,把它改为2级以上的流水乘法器。
  • 数据进出宏原语元件时,都用寄存器打一拍等。

(2)在包含宏原语元件的路径上减少逻辑层数,这点对改善整个设计的性能提升很明显。

Tips: 在修改RTL之前,可以尝试把DSP、RAM、URAM的自带流水寄存器使能都打开,然后重新编译工程,看时序是否能有改善。比如将下面这条路径:

设置如下属性:

set_property -dict {DOA_REG 1 DOB REG 1} [get_cells xx/ramb18_inst]

注意,由于使能这些寄存器后,逻辑时序会有变动,此时的RTL功能和你原先设计是有出入的,所以不用生成bitstream,这样操作的目的只是为了看时序能如何改善。

相关文章
|
2月前
|
算法 数据处理 异构计算
南京观海微电子----Verilog流水线设计——Pipeline
本文介绍FPGA设计中提升数据处理效率的流水线(Pipeline)技术。针对传统复制电路资源消耗大的问题,Pipeline通过将操作分解为时序均衡的多级处理段,实现数据并行处理,显著提高吞吐率与系统时钟频率,兼顾资源利用率与处理速度,适用于高速、大型FPGA系统设计。
南京观海微电子----Verilog流水线设计——Pipeline
|
3月前
|
机器人 数据挖掘 API
一个销售数据分析机器人的诞生:看 Dify 如何在 DMS 助力下实现自动化闭环
Dify 作为一款低代码 AI 应用开发平台,凭借其直观的可视化工作流编排能力,极大降低了大模型应用的开发门槛。
541 22
一个销售数据分析机器人的诞生:看 Dify 如何在 DMS 助力下实现自动化闭环
南京观海微电子---时序分析基本概念(二)——保持时间
本文详解触发器的保持时间(Th)概念,通过级联寄存器实例分析数据稳定要求,结合时序图推导保持时间裕量(Th_slack)计算公式,并给出具体计算示例,帮助理解数字电路中的时序约束与亚稳态问题。
南京观海微电子---时序分析基本概念(二)——保持时间
|
2月前
|
监控 安全 物联网
化工厂人员定位技术从系统架构到核心功能详解(一)
化工厂人员定位技术以UWB高精度定位为核心,融合物联网与大数据,构建五层系统架构,实现人员实时定位、电子围栏预警、一键SOS报警及应急联动,提升高危区域安全管控与应急响应能力。如果您想进一步了解定位的案例,欢迎关注、评论留言~也可搜索lbs智能定位。
|
2月前
|
人工智能 自然语言处理 算法
2025年12月,中国数字人平台技术革新与数字引擎未来生态
虚拟数字人技术正加速落地,领军企业凭借全链路技术与场景融合能力,推动金融、政务、电商等领域智能化升级,引领行业从形象还原迈向自主决策新阶段。
|
3月前
|
监控 应用服务中间件 API
Agentic 应用时代,Dify 全链路可观测最佳实践
本文讲述 Dify 平台在 Agentic 应用开发中面临的可观测性挑战,从开发者与运维方双重视角出发,系统分析了当前 Dify 可观测能力的现状、局限与改进方向
648 18
Agentic 应用时代,Dify 全链路可观测最佳实践
|
3月前
|
人工智能 自然语言处理 搜索推荐
文章“找茬”神器——媒体行业AI智能校对方案
年初DeepSeek大模型火爆以后,各行各业都在加速建设AI相关的场景,媒体行业无疑是大模型场景适配较好的一个行业。大模型凭借强大的内容生成能力,可以深度渗透内容生产的全链路环节,从热点事件的智能抓取、新闻稿件的快速生成,文章智能校对、个性化润色,大模型几乎可以重构传统内容生产流程。
429 15
|
2月前
|
Java Maven
apache-maven-3.9.9-bin.zip 使用步骤(超简单版)
下载Maven安装包并解压,配置MAVEN_HOME环境变量及Path路径,通过cmd输入mvn -v验证安装成功。建议修改本地仓库路径至非C盘,最后在IDEA中设置Maven路径以集成使用,完成开发环境配置。
|
2月前
|
监控 NoSQL Unix
我们来说一说 Redis IO 多路复用模型
我是小假 期待与你的下一次相遇 ~
210 4
南京观海微电子----时序分析基本概念(一)——建立时间
本文详解数字电路中建立时间(Tsu)概念,通过级联寄存器实例分析时序路径,推导建立时间裕量公式:Tsu_slack = Tcycle + Tclk2 - Tsu - (Tclk1 + Tco + Tdata),并计算电路最高工作频率,帮助理解时序约束与稳定性关系。