英特尔计划打造CPU-FPGA混合型芯片

简介:

两年之前,英特尔曾斥资167亿美元收购FPGA芯片制造商Altera公司。那么这笔巨额支出如今回报如何?芯片巨头终于打算给出答案。

英特尔计划打造CPU-FPGA混合型芯片

现场可编程门阵列,简称FPGA,是一类可定制以执行特定功能的集成电路。不同于仅执行x86指令集的x86处理器,FPGA能够实时重新编程以执行特定任务。因此前者被视为通用计算处理器,而后者则成为定制化处理器。

而Altera制定的策略非常有趣——实际上要与英特尔展开竞争。原本专门用于大规模浮点运算的英特尔至强Phi协处理器加英伟达或AMD GPU的组合,如今正面临FPGA的挑战。

与GPU类似,FPGA同样拥有两种使用方式:内联与外载。内联表示数据在交由FPGA进行处理前,首先通过CPU。而外载(也被称为旁路读出)意味着CPU被彻底排除在外,数据将直接由FPGA负责处理。

FPGA在处理特定任务时的表现优于至强Phi或GPU

如今,英特尔方面将Altera FPGA定义为协处理器,并承认将以某种方式与至强Phi展开竞争。但根据英特尔可编程解决方案部门软件解决方案高级主管Bernhard Friebe所言,FPGA在面对特定任务时,表现优于Phi或GPU。

他指出,“FPGA的优势在于,GPU适用于特定领域而非所有领域; 如果着眼于内联与外载使用模式,那么GPU仅限于外载。因此,FPGA能够覆盖更为广泛的应用领域。”

集成化解决方案以高带宽将CPU与FPGA紧密耦合起来,而外部PCIe卡则非紧密耦合。Friebe表示,对于要求低延迟高带宽应用而言,这样的集成方案非

他指出,“集成与离散之间的主要区别,在于系统架构与数据移动方式。在数据中心环境下,用户需要运行多种不同工作负载,而且当然不希望被绑死在特定应用身上。”

针对性程度越高,能够从加速器挤出的性能余量就越大。Friebe指出,作为多功能加速器的FPGA将能够在部分应用程序当中带来出色的性能表现。FPGA的特性在于高度并行与可编程能力,可显著加速并行化工作负载。此类负载具体包括数据分析、人工智能与机器学习、视频转码、压缩、安全、财务分析以及基因组学。

双管齐下的FPGA策略

英特尔在FPGA方面采取双管齐下的发展策略,即提供CPU-FPGA混合处理器——类似于在其桌面CPU之上集成GPU; 而Arria或Stratix品牌的FPGA设备则采用PCIe卡形式。

CPU-FPGA混合设备将基于Skylake CPU与Arria 10 FPGA,并将采用速度更快的UltraPath Interconnect(简称UPI)连接——即英特尔为QuickPath Interconnect(简称QPI)开发的继承性方案。目前UPI的相关情况尚不清楚,只能确定其可实现每秒9.6 GT或者每秒10.4 GT数据传输速率,且由于支持每消息多请求而较QPI更为高效。

英特尔还提供一套完备的开发者工具集以及API,可确保利用同一套工具、加速器以及库为集成化与离散型产品设计应用。其全部由OpenCL编写而成——这是一种类似于C的语言。

Friebe指出,“其亮点在于标准化与开源特性。所有投入皆兼容新一代处理器,易于迁移并为FPGA开发者提供一套抽象方案以面向更为庞大的用户群体。”

英特尔目前还公布了一款离散卡样品,名为可编程加速卡(简称PAC),其采用Arria 10 GX FPGA,且预计将于2018年上半年推出。同样发布演示的还有一套在Skylake一代至强处理器上集成FPGA的至强可扩展平台,其计划于2018年下半年正式推出。 


原文发布时间为:2017-10-13 

本文作者:核子可乐译

本文来自云栖社区合作伙伴“51CTO”,了解相关信息可以关注。

相关文章
|
6月前
|
机器学习/深度学习 人工智能 PyTorch
不止于大模型 英特尔CPU引领智算新高度
ChatGPT的横空出世拉开了AI大模型的新时代,而近期的文生视频模型SORA又让业界为之激动不已。据了解,Sora所需token(文本处理最小单位)数量相较于文本及图片模型的推理呈数量级增长。经中信证券简单估算,对于一个60帧的视频(约6至8秒),Sora要生成至少约120万个token,这是相当大的计算量。
|
机器学习/深度学习 调度 芯片
快速入门数字芯片设计,UCSD ECE111(九)FPGA vs ASIC(一)
快速入门数字芯片设计,UCSD ECE111(九)FPGA vs ASIC
100 0
|
6月前
|
存储 芯片 异构计算
【FPGA原型验证】FPGA 技术:芯片和工具-当今的 FPGA 器件技术_fpga原型版本
【FPGA原型验证】FPGA 技术:芯片和工具-当今的 FPGA 器件技术_fpga原型版本
182 0
|
6月前
|
机器学习/深度学习 数据采集 人工智能
为AI加速而生 英特尔第五代至强CPU带来AI新表现
AI时代,亲民、易用的CPU如何能实现相比GPU更具性价比的加速方案?英特尔® 至强® 可扩展处理器给出答案:内置AI加速引擎,更好地承载人工智能应用工作负载。
|
存储 前端开发 芯片
快速入门数字芯片设计,UCSD ECE111(九)FPGA vs ASIC(三)
快速入门数字芯片设计,UCSD ECE111(九)FPGA vs ASIC(三)
116 0
|
芯片 C++ 异构计算
快速入门数字芯片设计,UCSD ECE111(九)FPGA vs ASIC(二)
快速入门数字芯片设计,UCSD ECE111(九)FPGA vs ASIC(二)
81 0
|
存储 前端开发 Linux
(上)【数字IC精品文章收录】近500篇文章|学习路线|基础知识|接口|总线|脚本语言|芯片求职|安全|EDA|工具|低功耗设计|Verilog|低功耗|STA|设计|验证|FPGA|架构|AMBA|书籍|
【数字IC精品文章收录】近500篇文章|学习路线|基础知识|接口|总线|脚本语言|芯片求职|安全|EDA|工具|低功耗设计|Verilog|低功耗|STA|设计|验证|FPGA|架构|AMBA|书籍|
(上)【数字IC精品文章收录】近500篇文章|学习路线|基础知识|接口|总线|脚本语言|芯片求职|安全|EDA|工具|低功耗设计|Verilog|低功耗|STA|设计|验证|FPGA|架构|AMBA|书籍|
|
机器学习/深度学习 人工智能 安全
新至强训练推理增效十倍,英特尔CPU加速AI更上一层楼
英特尔在自己最擅长的 CPU 上完成了一次 AI 计算的革新。
304 0
新至强训练推理增效十倍,英特尔CPU加速AI更上一层楼
|
人工智能 算法 安全
(下)【数字IC精品文章收录】近500篇文章|学习路线|基础知识|接口|总线|脚本语言|芯片求职|安全|EDA|工具|低功耗设计|Verilog|低功耗|STA|设计|验证|FPGA|架构|AMBA|书籍|
【数字IC精品文章收录】近500篇文章|学习路线|基础知识|接口|总线|脚本语言|芯片求职|安全|EDA|工具|低功耗设计|Verilog|低功耗|STA|设计|验证|FPGA|架构|AMBA|书籍|
(下)【数字IC精品文章收录】近500篇文章|学习路线|基础知识|接口|总线|脚本语言|芯片求职|安全|EDA|工具|低功耗设计|Verilog|低功耗|STA|设计|验证|FPGA|架构|AMBA|书籍|
|
开发工具 芯片 异构计算
芯片设计:FPGA开发学习
芯片设计:FPGA开发学习
252 0
芯片设计:FPGA开发学习

热门文章

最新文章