英特尔推出新一代Stratix 10 FPGA加速卡:性能提升3倍

简介: 去年 10 月,英特尔发布了面向服务器的 FPGA 计算卡 Arria 10,并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年,我们就看到了 Arria 的继任者。9 月 26 日,这家芯片科技巨头宣布推出 Stratix 10 SX FPGA 的全新可编程加速卡。


英特尔的第二代 FPGA 计算卡仍面向数据中心,带来了更高的内存容量和带宽,其搭载的 280 万个逻辑单元数量为上一代 Arria 10 的两倍,这也使它成为了目前带宽最高的可编程加速平台。这款 PAC 加速卡专为内嵌处理和内存密集型工作负载而构建,如数据流分析和视屏转码。Hewlett Packard Enterprise(HPE)将是新卡的第一个 OEM 厂商。


微信图片_20211130103317.jpg


在新计算卡的性能参数上,值得注意的是功耗:新卡 225W 的最大功耗相比 75W 的第一代产品增加了很多,高能耗也带来了更强大的计算性能。另外,Stratix 10 采用了 4 通道 DDR 4DIMM 内存(容量为 32GB);计算卡尺寸为 3/4 长,采用双槽 PCIE 3 插槽(前代产品为单槽设计)。


对于英特尔而言,新计算卡丰富了其 FPGA 计算卡的产品线。Stratix 10 在片上和片外存储方面有了大幅增长,其片上存储容量是前一代的四倍。大幅增长的内存储带来了更高的吞吐量,让这些计算卡更加适用于实时视频数据分析和转码等应用。而容量为 32G 的 DDR 4 内存则可以让绝大多数应用程序在其上运行得更快。


虽然目前还没有放出基准测试成绩,但和广泛占据市场份额的 GPU 产品相比,Stratix 10 从架构上来看具有一些优势:其板载以太网单元可支持内嵌处理,帮助用户实现实时的数据分析,这可以为零售等行业带来竞争上的优势。英特尔称,和 Arria 10 加速卡相比,从速度和成本上来看,第二代产品有了 3 倍的性能提升。


微信图片_20211130103320.jpg


英特尔旗下的 FPGA 计算卡已经投入市场超过一年时间,因其性能/功耗比的优势,Arria 10 在图像处理领域已有一些应用案例。另一方面,金融领域也是英特尔希望努力进入的市场。Stratix 10 的高带宽在风险管控任务中的表现也值得期待。


实时数据分析是另一个重要市场方向,此前的 Arria 在零售业等行业的数据中心已有一些应用,而 Stratix 10 可以为各家企业带来更高的带宽,以及更大的分析空间。


「Stratix 10 有强大的计算能力,另一方面,这张计算卡还有片上以太网接口。当接入数据流时,算法分析可由 FPGA 进行实时加速,而基于 Spark 的软件堆栈可以帮助开发者进行快速部署。」英特尔 PSG 部门总监、加速平台市场负责人 Sabrina Gomez 介绍道。


微信图片_20211130103323.jpg

英特尔新推出的 Stratix 10 FPGA 计算卡面向更高性能需求的应用。


除了自产的 FPGA 加速卡之外,本次英特尔还提供了支持旗下 Xeon 处理器和 FPGA 芯片的加速栈,包括一套常用的 API 和开源驱动程序。英特尔称,它们能够与行业领先操作系统、虚拟化及协调软件无缝配合。「不管开发者过去的技能水平如何,他们都可以很容易地接收英特尔的产品。英特尔的开发工具质量很高,也有很多合作伙伴支持。」英特尔亚太区产品市场经理谢晓东介绍道。


一个月前,英特尔在 VMworld 上推出了支持虚拟化的框架。现在,客户已经可以直接在 FPGA 加速卡上做 VMware 虚拟化了。


在操作系统方面,英特尔表示自己和 OEM、IP、操作系统和集成设备厂商进行了合作,将 FPGA 驱动上传到 Linux 内核中,从而得到了广泛的 Linux 支持。


针对 FPGA 平台,英特尔甚至推出了应用商店「Workload Store Front」,支持简单的评估和快速部署,用户在其之上可以找到各种工具,并「先试后买」。


HPE 副总裁兼 HPC 与 AI 事业部总经理 Bill Mannel 表示:「我们看到基于 FPGA 的加速器市场增长迅速,越来越多的开发人员都可采用全新的英特尔 FPGA 解决方案工具,实现工作负载加速。我们计划在新产品中使用英特尔 Stratix 10 PAC 和加速栈,以帮助客户轻松管理复杂及新兴的工作负载。」


微信图片_20211130103327.jpg

英特尔在 FPGA 加速器上提供了完整的解决方案。


对于定制化设计,英特尔也持开放态度。英特尔会向有需求的客户提供参考设计,帮助客户针对自己的需求选择加速卡配置,这家公司希望以此不断扩展加速产品的组合。


对于 FPGA 计算卡未来的市场,英特尔很有信心。「目前的计算卡市场,包含 GPU、ASIC、FPGA 等芯片形态,其体量为 180 亿-200 亿美元。单看企业级市场的话,规模为数十亿美元。在这其中,FPGA 因其独特的能力,会在其中占据很大一部分份额。」Sabrina Gomez 表示。


目前,英特尔的 FPGA 计算卡主要应用于各家企业的数据中心,这家公司希望未来 FPGA 也能在云端有更多部署。加速产品市场前景广阔,英特尔正处在有利的位置。未来,FPGA 或许会出现在更多基础设施、物联网设备之中。 微信图片_20211130092842.png


相关文章
|
存储 数据中心 异构计算
|
人工智能 数据安全/隐私保护 异构计算
|
26天前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的16QAM调制+软解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本项目基于FPGA实现了16QAM基带通信系统,包括调制、信道仿真、解调及误码率统计模块。通过Vivado2019.2仿真,设置不同SNR(如8dB、12dB),验证了软解调相较于传统16QAM系统的优越性,误码率显著降低。系统采用Verilog语言编写,详细介绍了16QAM软解调的原理及实现步骤,适用于高性能数据传输场景。
131 69
|
1月前
|
移动开发 算法 数据安全/隐私保护
基于FPGA的QPSK调制+软解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的QPSK调制解调系统,通过Vivado 2019.2进行仿真,展示了在不同信噪比(SNR=1dB, 5dB, 10dB)下的仿真效果。与普通QPSK系统相比,该系统的软解调技术显著降低了误码率。文章还详细阐述了QPSK调制的基本原理、信号采样、判决、解调及软解调的实现过程,并提供了Verilog核心程序代码。
67 26
|
2月前
|
算法 异构计算
基于FPGA的4ASK调制解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的4-ASK调制解调系统的算法仿真效果、理论基础及Verilog核心程序。仿真在Vivado2019.2环境下进行,分别测试了SNR为20dB、15dB、10dB时的性能。理论部分概述了4-ASK的工作原理,包括调制、解调过程及其数学模型。Verilog代码实现了4-ASK调制器、加性高斯白噪声(AWGN)信道模拟、解调器及误码率计算模块。
65 8
|
2月前
|
算法 物联网 异构计算
基于FPGA的4FSK调制解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的4FSK调制解调系统的Verilog实现,包括高斯信道模块和误码率统计模块,支持不同SNR设置。系统在Vivado 2019.2上开发,展示了在不同SNR条件下的仿真结果。4FSK调制通过将输入数据转换为四个不同频率的信号来提高频带利用率和抗干扰能力,适用于无线通信和数据传输领域。文中还提供了核心Verilog代码,详细描述了调制、加噪声、解调及误码率计算的过程。
65 11
|
2月前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的1024QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的1024QAM调制解调系统的仿真与实现。通过Vivado 2019.2进行仿真,分别在SNR=40dB和35dB下验证了算法效果,并将数据导入Matlab生成星座图。1024QAM调制将10比特映射到复数平面上的1024个星座点之一,适用于高数据传输速率的应用。系统包含数据接口、串并转换、星座映射、调制器、解调器等模块。Verilog核心程序实现了调制、加噪声信道和解调过程,并统计误码率。
52 1
|
3月前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的64QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的64QAM调制解调通信系统的设计与实现,包括信号生成、调制、解调和误码率测试。系统在Vivado 2019.2中进行了仿真,通过设置不同SNR值(15、20、25)验证了系统的性能,并展示了相应的星座图。核心程序使用Verilog语言编写,加入了信道噪声模块和误码率统计功能,提升了仿真效率。
63 4

热门文章

最新文章