1. 函数层面的优化
从函数这个角度来说代码风格,主要是看参数的数据类型,C++中的数据类型是以8为边界的,而实际硬件中我们可能会遇到任意精度的数据类型,因此我们一定在C++中定义为任意精度的数据类型;
2. Inline
对函数的Inline实际是去除函数的层次化,带来的好处是可以改善资源,不再需要调用函数的相关逻辑,对于小函数HLS会自动Inline,如果我们不希望,可以通过directive中的 -off这个选型来实现
3. ALLOCATION
定义了函数与相应RTL model之间的关系,ALLOCATION使副本并行运行,从而减少延迟性,配置与结果如下图所示,allocation的影响,它实际上是在Latency和Area上做折衷。
4. Task Level Pipelining: Dataflow
- 实际上是做并行处理,可以看到用到了channel,channel可以是ping-pong RAM,也可以是FIFO;
- Dataflow可以作用于一些顺序处理的任务,比如函数或者循环,或者两者都有;
- Dataflow是将顺序处理变为并行处理,使得当前任务不需要前面的任务结束才执行,可以并行处理,所以Dataflow允许任务之间有交叠,提高了数据吞吐量,降低了Latency;
5. 总结