英特尔推出新一代Stratix 10 FPGA加速卡:性能提升3倍

简介: 去年 10 月,英特尔发布了面向服务器的 FPGA 计算卡 Arria 10,并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年,我们就看到了 Arria 的继任者。9 月 26 日,这家芯片科技巨头宣布推出 Stratix 10 SX FPGA 的全新可编程加速卡。


英特尔的第二代 FPGA 计算卡仍面向数据中心,带来了更高的内存容量和带宽,其搭载的 280 万个逻辑单元数量为上一代 Arria 10 的两倍,这也使它成为了目前带宽最高的可编程加速平台。这款 PAC 加速卡专为内嵌处理和内存密集型工作负载而构建,如数据流分析和视屏转码。Hewlett Packard Enterprise(HPE)将是新卡的第一个 OEM 厂商。


微信图片_20211130103317.jpg


在新计算卡的性能参数上,值得注意的是功耗:新卡 225W 的最大功耗相比 75W 的第一代产品增加了很多,高能耗也带来了更强大的计算性能。另外,Stratix 10 采用了 4 通道 DDR 4DIMM 内存(容量为 32GB);计算卡尺寸为 3/4 长,采用双槽 PCIE 3 插槽(前代产品为单槽设计)。


对于英特尔而言,新计算卡丰富了其 FPGA 计算卡的产品线。Stratix 10 在片上和片外存储方面有了大幅增长,其片上存储容量是前一代的四倍。大幅增长的内存储带来了更高的吞吐量,让这些计算卡更加适用于实时视频数据分析和转码等应用。而容量为 32G 的 DDR 4 内存则可以让绝大多数应用程序在其上运行得更快。


虽然目前还没有放出基准测试成绩,但和广泛占据市场份额的 GPU 产品相比,Stratix 10 从架构上来看具有一些优势:其板载以太网单元可支持内嵌处理,帮助用户实现实时的数据分析,这可以为零售等行业带来竞争上的优势。英特尔称,和 Arria 10 加速卡相比,从速度和成本上来看,第二代产品有了 3 倍的性能提升。


微信图片_20211130103320.jpg


英特尔旗下的 FPGA 计算卡已经投入市场超过一年时间,因其性能/功耗比的优势,Arria 10 在图像处理领域已有一些应用案例。另一方面,金融领域也是英特尔希望努力进入的市场。Stratix 10 的高带宽在风险管控任务中的表现也值得期待。


实时数据分析是另一个重要市场方向,此前的 Arria 在零售业等行业的数据中心已有一些应用,而 Stratix 10 可以为各家企业带来更高的带宽,以及更大的分析空间。


「Stratix 10 有强大的计算能力,另一方面,这张计算卡还有片上以太网接口。当接入数据流时,算法分析可由 FPGA 进行实时加速,而基于 Spark 的软件堆栈可以帮助开发者进行快速部署。」英特尔 PSG 部门总监、加速平台市场负责人 Sabrina Gomez 介绍道。


微信图片_20211130103323.jpg

英特尔新推出的 Stratix 10 FPGA 计算卡面向更高性能需求的应用。


除了自产的 FPGA 加速卡之外,本次英特尔还提供了支持旗下 Xeon 处理器和 FPGA 芯片的加速栈,包括一套常用的 API 和开源驱动程序。英特尔称,它们能够与行业领先操作系统、虚拟化及协调软件无缝配合。「不管开发者过去的技能水平如何,他们都可以很容易地接收英特尔的产品。英特尔的开发工具质量很高,也有很多合作伙伴支持。」英特尔亚太区产品市场经理谢晓东介绍道。


一个月前,英特尔在 VMworld 上推出了支持虚拟化的框架。现在,客户已经可以直接在 FPGA 加速卡上做 VMware 虚拟化了。


在操作系统方面,英特尔表示自己和 OEM、IP、操作系统和集成设备厂商进行了合作,将 FPGA 驱动上传到 Linux 内核中,从而得到了广泛的 Linux 支持。


针对 FPGA 平台,英特尔甚至推出了应用商店「Workload Store Front」,支持简单的评估和快速部署,用户在其之上可以找到各种工具,并「先试后买」。


HPE 副总裁兼 HPC 与 AI 事业部总经理 Bill Mannel 表示:「我们看到基于 FPGA 的加速器市场增长迅速,越来越多的开发人员都可采用全新的英特尔 FPGA 解决方案工具,实现工作负载加速。我们计划在新产品中使用英特尔 Stratix 10 PAC 和加速栈,以帮助客户轻松管理复杂及新兴的工作负载。」


微信图片_20211130103327.jpg

英特尔在 FPGA 加速器上提供了完整的解决方案。


对于定制化设计,英特尔也持开放态度。英特尔会向有需求的客户提供参考设计,帮助客户针对自己的需求选择加速卡配置,这家公司希望以此不断扩展加速产品的组合。


对于 FPGA 计算卡未来的市场,英特尔很有信心。「目前的计算卡市场,包含 GPU、ASIC、FPGA 等芯片形态,其体量为 180 亿-200 亿美元。单看企业级市场的话,规模为数十亿美元。在这其中,FPGA 因其独特的能力,会在其中占据很大一部分份额。」Sabrina Gomez 表示。


目前,英特尔的 FPGA 计算卡主要应用于各家企业的数据中心,这家公司希望未来 FPGA 也能在云端有更多部署。加速产品市场前景广阔,英特尔正处在有利的位置。未来,FPGA 或许会出现在更多基础设施、物联网设备之中。 微信图片_20211130092842.png


相关文章
|
存储 数据中心 异构计算
|
人工智能 数据安全/隐私保护 异构计算
|
21天前
|
机器学习/深度学习 算法 异构计算
m基于FPGA的多通道FIR滤波器verilog实现,包含testbench测试文件
本文介绍了使用VIVADO 2019.2仿真的多通道FIR滤波器设计。展示了系统RTL结构图,并简述了FIR滤波器的基本理论,包括单通道和多通道的概念、常见结构及设计方法,如窗函数法、频率采样法、优化算法和机器学习方法。此外,还提供了Verilog核心程序代码,用于实现4通道滤波器模块,包含时钟、复位信号及输入输出接口的定义。
38 7
|
3月前
|
算法 异构计算
基于FPGA的ECG信号滤波与心率计算verilog实现,包含testbench
基于FPGA的ECG信号滤波与心率计算verilog实现,包含testbench
|
2月前
|
算法 异构计算
m基于FPGA的电子钟verilog实现,可设置闹钟,包含testbench测试文件
该文介绍了基于FPGA的电子钟设计,利用Vivado2019.2平台进行开发并展示测试结果。电子钟设计采用Verilog硬件描述语言,核心包括振荡器、分频器和计数器。时间显示为2个十进制格式,闹钟功能通过存储器和比较器实现,当当前时间等于设定时间时触发。文中给出了Verilog核心程序示例,展示了时钟信号、设置信号及输出的交互。
36 2
|
4月前
|
算法 5G 数据处理
m基于FPGA的PPM光学脉位调制解调系统verilog实现,包含testbench
m基于FPGA的PPM光学脉位调制解调系统verilog实现,包含testbench
58 0
|
4月前
|
算法 异构计算 索引
m基于FPGA的Hamming汉明编译码verilog实现,包含testbench测试文件,不使用IP核
m基于FPGA的Hamming汉明编译码verilog实现,包含testbench测试文件,不使用IP核
51 1
|
2月前
|
算法 异构计算
m基于FPGA的RS+卷积级联编译码实现,RS用IP核实现,卷积用verilog实现,包含testbench测试文件
m基于FPGA的RS+卷积级联编译码实现,RS用IP核实现,卷积用verilog实现,包含testbench测试文件
16 0

热门文章

最新文章