英特尔称将于2017年发布AI超级芯片:至强Phi Knights Mill

简介:

英特尔公司目前正积极面向服务器及工作站设备开发一款强大的至强Phi处理器,旨在针对人工智能软件进行“优化”——目前其代号已经公布,名为Knights Mill。

芯片巨头的数据中心部门负责人Diane Bryant在本届于旧金山召开的英特尔开发者论坛上表示:

这款芯片主要面向深度学习类应用,且预计将在2017年年内推出。其将在芯片之上采用堆叠式内存,实现多功能、多核心并主要面向高性能浮点计算——这一切都是为了帮助其在高通量机器学习场景下快速执行操作。

更重要的是,Mill不配备加速器或者协处理器:其可运行x86代码并能够在不涉及主机CPU的情况下引导并运行操作系统及应用。这样的设计使其与英伟达GPU等竞争芯片区别开来——后者主机处理器协助其定向。

根据英特尔公司的说法,Knights Mill“针对向外扩展分析方案进行了伦,且包含多项深度学习训练强化机制。对于目前的机器学习应用,英特尔至强Phi处理器家族配备的大规模内存容量能够帮助百度等客户轻松高效地完成模型训练。”

Mill为至强Phi家族中的最新成员,且仍在快速发展当中。作为姊妹产品,Knights Hill为公布于2014年的第三代10纳米Phi处理器,其将用于美国能源部即将推出的180 PFLOPS Aurora等多台超级计算机。

与此同时,公布于2013年的第二代14纳米Phi Knights Landing已经于今年6月开始销售。其具备72个凌动Airmont核心,且能够访问高达16 GB堆叠式3D RAM以及高达384 GB的普通DDR4内存。其将被用于美国的Cori超级计算机。在Knights Landing之前,该家族还拥有Knights Corner与Knights Ferry两位成员。

至强Phi家族主要面向高性能服务器与系统,产品售价亦相当夸张。一块Knights Landing处理器的起步价格达2500美元,截至目前亦只有高校及政府机构能够利用其运行模拟及材料研究等负载。如今凭借着对AI初创企业Nervana的收购,英特尔公司开始将Phi家族转移向人工智能领域,而英伟达将成为其主要竞争对手。



原文发布时间为:2016年8月18日

本文作者:孙博 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关文章
|
5天前
|
存储 弹性计算 人工智能
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
2025年9月24日,阿里云弹性计算团队多位产品、技术专家及服务器团队技术专家共同在【2025云栖大会】现场带来了《通用计算产品发布与行业实践》的专场论坛,本论坛聚焦弹性计算多款通用算力产品发布。同时,ECS云服务器安全能力、资源售卖模式、计算AI助手等用户体验关键环节也宣布升级,让用云更简单、更智能。海尔三翼鸟云服务负责人刘建锋先生作为特邀嘉宾,莅临现场分享了关于阿里云ECS g9i推动AIoT平台的场景落地实践。
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
|
4天前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
|
4天前
|
人工智能 自然语言处理 自动驾驶
关于举办首届全国大学生“启真问智”人工智能模型&智能体大赛决赛的通知
关于举办首届全国大学生“启真问智”人工智能模型&智能体大赛决赛的通知
|
Linux 虚拟化 iOS开发
VMware Workstation Pro 25H2 for Windows & Linux - 领先的免费桌面虚拟化软件
VMware Workstation Pro 25H2 for Windows & Linux - 领先的免费桌面虚拟化软件
1022 0
|
7天前
|
存储 机器学习/深度学习 人工智能
大模型微调技术:LoRA原理与实践
本文深入解析大语言模型微调中的关键技术——低秩自适应(LoRA)。通过分析全参数微调的计算瓶颈,详细阐述LoRA的数学原理、实现机制和优势特点。文章包含完整的PyTorch实现代码、性能对比实验以及实际应用场景,为开发者提供高效微调大模型的实践指南。
648 2
|
6天前
|
JavaScript API 开发工具
如何在原生App中调用Uniapp的原生功能?
如何在原生App中调用Uniapp的原生功能?
318 139
|
5天前
|
编解码 自然语言处理 文字识别
Qwen3-VL再添丁!4B/8B Dense模型开源,更轻量,仍强大
凌晨,Qwen3-VL系列再添新成员——Dense架构的Qwen3-VL-8B、Qwen3-VL-4B 模型,本地部署友好,并完整保留了Qwen3-VL的全部表现,评测指标表现优秀。
441 7
Qwen3-VL再添丁!4B/8B Dense模型开源,更轻量,仍强大