英特尔推出新一代Stratix 10 FPGA加速卡:性能提升3倍

简介: 去年 10 月,英特尔发布了面向服务器的 FPGA 计算卡 Arria 10,并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年,我们就看到了 Arria 的继任者。9 月 26 日,这家芯片科技巨头宣布推出 Stratix 10 SX FPGA 的全新可编程加速卡。


英特尔的第二代 FPGA 计算卡仍面向数据中心,带来了更高的内存容量和带宽,其搭载的 280 万个逻辑单元数量为上一代 Arria 10 的两倍,这也使它成为了目前带宽最高的可编程加速平台。这款 PAC 加速卡专为内嵌处理和内存密集型工作负载而构建,如数据流分析和视屏转码。Hewlett Packard Enterprise(HPE)将是新卡的第一个 OEM 厂商。


微信图片_20211130103317.jpg


在新计算卡的性能参数上,值得注意的是功耗:新卡 225W 的最大功耗相比 75W 的第一代产品增加了很多,高能耗也带来了更强大的计算性能。另外,Stratix 10 采用了 4 通道 DDR 4DIMM 内存(容量为 32GB);计算卡尺寸为 3/4 长,采用双槽 PCIE 3 插槽(前代产品为单槽设计)。


对于英特尔而言,新计算卡丰富了其 FPGA 计算卡的产品线。Stratix 10 在片上和片外存储方面有了大幅增长,其片上存储容量是前一代的四倍。大幅增长的内存储带来了更高的吞吐量,让这些计算卡更加适用于实时视频数据分析和转码等应用。而容量为 32G 的 DDR 4 内存则可以让绝大多数应用程序在其上运行得更快。


虽然目前还没有放出基准测试成绩,但和广泛占据市场份额的 GPU 产品相比,Stratix 10 从架构上来看具有一些优势:其板载以太网单元可支持内嵌处理,帮助用户实现实时的数据分析,这可以为零售等行业带来竞争上的优势。英特尔称,和 Arria 10 加速卡相比,从速度和成本上来看,第二代产品有了 3 倍的性能提升。


微信图片_20211130103320.jpg


英特尔旗下的 FPGA 计算卡已经投入市场超过一年时间,因其性能/功耗比的优势,Arria 10 在图像处理领域已有一些应用案例。另一方面,金融领域也是英特尔希望努力进入的市场。Stratix 10 的高带宽在风险管控任务中的表现也值得期待。


实时数据分析是另一个重要市场方向,此前的 Arria 在零售业等行业的数据中心已有一些应用,而 Stratix 10 可以为各家企业带来更高的带宽,以及更大的分析空间。


「Stratix 10 有强大的计算能力,另一方面,这张计算卡还有片上以太网接口。当接入数据流时,算法分析可由 FPGA 进行实时加速,而基于 Spark 的软件堆栈可以帮助开发者进行快速部署。」英特尔 PSG 部门总监、加速平台市场负责人 Sabrina Gomez 介绍道。


微信图片_20211130103323.jpg

英特尔新推出的 Stratix 10 FPGA 计算卡面向更高性能需求的应用。


除了自产的 FPGA 加速卡之外,本次英特尔还提供了支持旗下 Xeon 处理器和 FPGA 芯片的加速栈,包括一套常用的 API 和开源驱动程序。英特尔称,它们能够与行业领先操作系统、虚拟化及协调软件无缝配合。「不管开发者过去的技能水平如何,他们都可以很容易地接收英特尔的产品。英特尔的开发工具质量很高,也有很多合作伙伴支持。」英特尔亚太区产品市场经理谢晓东介绍道。


一个月前,英特尔在 VMworld 上推出了支持虚拟化的框架。现在,客户已经可以直接在 FPGA 加速卡上做 VMware 虚拟化了。


在操作系统方面,英特尔表示自己和 OEM、IP、操作系统和集成设备厂商进行了合作,将 FPGA 驱动上传到 Linux 内核中,从而得到了广泛的 Linux 支持。


针对 FPGA 平台,英特尔甚至推出了应用商店「Workload Store Front」,支持简单的评估和快速部署,用户在其之上可以找到各种工具,并「先试后买」。


HPE 副总裁兼 HPC 与 AI 事业部总经理 Bill Mannel 表示:「我们看到基于 FPGA 的加速器市场增长迅速,越来越多的开发人员都可采用全新的英特尔 FPGA 解决方案工具,实现工作负载加速。我们计划在新产品中使用英特尔 Stratix 10 PAC 和加速栈,以帮助客户轻松管理复杂及新兴的工作负载。」


微信图片_20211130103327.jpg

英特尔在 FPGA 加速器上提供了完整的解决方案。


对于定制化设计,英特尔也持开放态度。英特尔会向有需求的客户提供参考设计,帮助客户针对自己的需求选择加速卡配置,这家公司希望以此不断扩展加速产品的组合。


对于 FPGA 计算卡未来的市场,英特尔很有信心。「目前的计算卡市场,包含 GPU、ASIC、FPGA 等芯片形态,其体量为 180 亿-200 亿美元。单看企业级市场的话,规模为数十亿美元。在这其中,FPGA 因其独特的能力,会在其中占据很大一部分份额。」Sabrina Gomez 表示。


目前,英特尔的 FPGA 计算卡主要应用于各家企业的数据中心,这家公司希望未来 FPGA 也能在云端有更多部署。加速产品市场前景广阔,英特尔正处在有利的位置。未来,FPGA 或许会出现在更多基础设施、物联网设备之中。 微信图片_20211130092842.png


相关文章
|
5月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于FPGA的SNN脉冲神经网络之LIF神经元verilog实现,包含testbench
本项目展示了 LIF(Leaky Integrate-and-Fire)神经元算法的实现与应用,含无水印运行效果预览。基于 Vivado2019.2 开发,完整代码配有中文注释及操作视频。LIF 模型模拟生物神经元特性,通过积分输入信号并判断膜电位是否达阈值产生脉冲,相较于 Hodgkin-Huxley 模型更简化,适合大规模神经网络模拟。核心程序片段示例,助您快速上手。
|
8月前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的变步长LMS自适应滤波器verilog实现,包括testbench
### 自适应滤波器仿真与实现简介 本项目基于Vivado2022a实现了变步长LMS自适应滤波器的FPGA设计。通过动态调整步长因子,该滤波器在收敛速度和稳态误差之间取得良好平衡,适用于信道均衡、噪声消除等信号处理应用。Verilog代码展示了关键模块如延迟单元和LMS更新逻辑。仿真结果验证了算法的有效性,具体操作可参考配套视频。
299 74
|
6月前
|
算法 数据安全/隐私保护 异构计算
基于LSB最低有效位的音频水印嵌入提取算法FPGA实现,包含testbench和MATLAB对比
本项目展示了一种基于FPGA的音频水印算法,采用LSB(最低有效位)技术实现版权保护与数据追踪功能。使用Vivado2019.2和Matlab2022a开发,完整代码含中文注释及操作视频。算法通过修改音频采样点的最低有效位嵌入水印,人耳难以察觉变化。然而,面对滤波或压缩等攻击时,水印提取可能受影响。该项目运行效果无水印干扰,适合实时应用场景,核心逻辑简单高效,时间复杂度低。
|
6月前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的2ASK+帧同步系统verilog开发,包含testbench,高斯信道,误码统计,可设置SNR
本内容展示了基于Vivado2019.2的算法仿真效果,包括设置不同信噪比(SNR=8db和20db)下的结果及整体波形。同时,详细介绍了2ASK调制解调技术的原理与实现,即通过改变载波振幅传输二进制信号,并提供数学公式支持。此外,还涉及帧同步理论,用于确定数据帧起始位置。最后,给出了Verilog核心程序代码,实现了2ASK解调与帧同步功能,结合DDS模块生成载波信号,完成信号处理流程。
116 0
|
9月前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的16QAM调制+软解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本项目基于FPGA实现了16QAM基带通信系统,包括调制、信道仿真、解调及误码率统计模块。通过Vivado2019.2仿真,设置不同SNR(如8dB、12dB),验证了软解调相较于传统16QAM系统的优越性,误码率显著降低。系统采用Verilog语言编写,详细介绍了16QAM软解调的原理及实现步骤,适用于高性能数据传输场景。
378 69
|
6月前
|
编解码 算法 数据安全/隐私保护
基于FPGA的信号DM编解码实现,包含testbench和matlab对比仿真
本项目展示了DM编解码算法的实现与测试结果。FPGA测试结果显示为T1,Matlab仿真结果为T2。使用软件版本为Matlab 2022a和Vivado 2019.2。核心程序包含详细中文注释和操作视频。DM编解码通过比较信号样本差值进行编码,适用于音频等低频信号处理。硬件结构包括编码器(采样器、减法器、比较器)和解码器(解码器、积分器)。

热门文章

最新文章