Xilinx Zynq7035算力指标

简介: 本文介绍广州星嵌DSP C6657+Xilinx Zynq7035平台下Xilinx Zynq7035算力指标。

目的
本文介绍广州星嵌DSP C6657+Xilinx Zynq7035平台下Xilinx Zynq7035算力指标。

基本概念

FLOPs/FLOPS
FLOPs,Floating Point Operations,浮点运算次数,每一个加、减、乘、除操作都算1FLOPs操作,常用来衡量模型计算复杂度。
注意下FLOPS,注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标,两者别弄混。

MACs
Multiply–Accumulate Operations,乘加累积操作数,常常被人们与FLOPs概念混淆。实际上1MACs包含一个乘法操作与一个加法操作,大约包含2FLOPs。通常MACs与FLOPs存在一个2倍的关系。

关系
为什么使用乘加运算指标(MACs)呢?因为神经网络运算中内积、乘加运算无处不在:

对于一个3*3滤波器在特征图上的一次运算可以表示为:
y = w 0 ∗ x 0 + w 1 ∗ x 1 + w 2 ∗ x 2 + w 3 ∗ x 3 + w 4 ∗ x 4 + w 5 ∗ x 5 + w 6 ∗ x 6 + w 7 ∗ x 7 + w 8 ∗ x 8

对于上式,记 w 0 ∗ x 0 +… 为一次乘加,即1MACs。所以对于上式而言共有9次乘加,即9MACs(实际上,9次相乘、9-1次相加,但为了方便统计,将计算量近似记为9MACs,就像算法复杂度通常把 O(N+b)表示成O(N)一样,都只是一种近似)。

对于上式而言,可以认为执行了9次乘法、9-1次加法,所以一共是9+(9-1)次FLOPs。所以近似来看1FLOPs ≈ 2MACs。

ZYNQ PL端算力指标
参考Xilinx官方文档Zynq-7000 SoC Data Sheet: Overview (DS190),可找到Zynq 7035 PL端的MACs指标值为1334 GMACs,约为2668 GFLOPs,如下图所示:
mark_图片1.png

FPGA PS端性能指标
参考Xilinx官方资料Zynq-7000 SoC Data Sheet: Overview (DS190),可获得Zynq 7035 PS端CPU的性能参数,如下图红框标出的地方所示:
mark_图片2.png

mark_图片3.png

Zynq 7035 PS端双ARM总运算能力:2.5DMIPS/MHz Per CPU x 1000 MHz x 2 CPU = 5000 DMIPS。

相关文章
uniapp引入阿里图标库
平时项目开发肯定少不了图标的使用,除了自己定制图标库之外,再一个比较不错的就是使用阿里的图标库,这里包含了很多分类的图标,基本上你想用的图标它都有,不仅好看,使用起来也是非常方便的,下面一起来看看吧。
1196 0
uniapp引入阿里图标库
|
6月前
|
监控 安全 物联网
常见的室内定位技术有哪些?深度剖析UWB、蓝牙定位等技术的优劣与应用场景
本文解析UWB、蓝牙BLE、Wi-Fi三大室内定位技术的原理、优缺点及应用场景,涵盖高精度定位、低功耗部署与成本考量,助力选择最优方案。
|
6月前
|
算法 定位技术
蓝牙室内定位核心技术解析:RSSI 与 AOA 的测距原理对比与精度升级逻辑
本文解析蓝牙室内定位核心技术,对比RSSI与AOA的测距原理,深入探讨从RSSI到AOA在精度、误差控制和硬件适配方面的升级逻辑,揭示两者如何互补满足不同场景需求。
|
9月前
|
安全 IDE Java
【分享排雷经历】系统引入Apache-Tika产生的NoClassDefFoundError错误
为实现文件导入的安全控制,在系统中引入了基于`Apache Tika`的文件类型校验机制。但在运行时出现`NoClassDefFoundError`,提示缺少`commons-io`类。经排查发现,`monorepo`依赖的`commons-io`版本(2.6)低于Tika 2.9.1所需版本(2.16.1)。由于系统依赖统一管理,直接升级`commons-io`可能影响其他模块。最终解决方案为降级Tika版本至2.4.1,该版本兼容`commons-io:2.6`,问题得以解决且功能满足需求。
513 0
|
6月前
|
数据采集 算法 物联网
蓝牙定位技术原理:从BLE信号到高精度定位的实现逻辑
蓝牙定位凭借低成本、低功耗与高兼容性,依托BLE信号实现从粗略到高精度的定位。通过RSSI、ToF测距与AoA/AoD测向技术,结合多基站协同和算法优化,可实现米级乃至厘米级定位,广泛应用于室内场景。
|
12月前
|
存储 安全 JavaScript
【HarmonyOS Next之旅】HarmonyOS概述(二)
HarmonyOS是面向万物互联时代的分布式操作系统,支持多种终端设备,提供全场景业务能力。其三大特征包括超级终端融合、一次开发多端部署及统一OS弹性部署。技术架构分为内核层、系统服务层、框架层和应用层,确保系统灵活性与高效性。同时,HarmonyOS通过分布式多端协同身份认证、可信运行环境和数据全生命周期保护,保障系统安全,实现“正确的人、正确的设备、正确地使用数据”。
561 0
|
机器学习/深度学习 人工智能 算法
【AI系统】推理参数
本文介绍了AI模型网络参数的基本概念及硬件性能指标,探讨了模型轻量化的重要性。随着深度学习的发展,模型参数量和计算量不断增大,导致难以直接部署到移动端。文章详细解析了FLOPs、FLOPS、MACCs等计算指标,并对比了标准卷积层、Group卷积、Depth-wise卷积和全连接层的参数计算方法,为模型优化提供了理论基础。
890 1
|
人工智能 自然语言处理 算法
《解锁鸿蒙AI开发:探秘必备集成开发环境》
在鸿蒙系统与人工智能融合的创新浪潮中,选择合适的开发工具至关重要。DevEco Studio作为华为官方的全能开发利器,基于IntelliJ IDEA,提供丰富的项目模板、智能代码补全和强大的调试优化功能,助力开发者高效完成应用开发。DevEco CodeGenie通过AI赋能,以智能知识问答和代码生成功能显著提升开发效率,减少重复性工作。而Visual Studio Code凭借其轻量灵活的特点和丰富的插件生态,为鸿蒙开发提供了更多选择。三者各具优势,开发者可根据需求选择最适合的工具,共同推动鸿蒙生态的繁荣发展。
569 0
|
机器学习/深度学习 传感器 人工智能
【博士每天一篇论文-综述】Brain Inspired Computing : A Systematic Survey and Future Trends
本文提供了对脑启发计算(BIC)领域的系统性综述,深入探讨了BIC的理论模型、硬件架构、软件工具、基准数据集,并分析了该领域在人工智能中的重要性、最新进展、主要挑战和未来发展趋势。
630 2
【博士每天一篇论文-综述】Brain Inspired Computing : A Systematic Survey and Future Trends
|
机器学习/深度学习 自然语言处理 监控
深度学习之声音事件检测
基于深度学习的声音事件检测(Sound Event Detection, SED)是指从音频数据中检测并识别出特定的声音事件(如玻璃破碎、狗叫声、警报声等)。这种技术被广泛应用于智能家居、城市监控、医疗监护等领域,随着深度学习的进步,其性能和准确性得到了显著提升。
1628 0

热门文章

最新文章