速度提升49倍,英伟达发布量子混合编程平台QODA

简介: 速度提升49倍,英伟达发布量子混合编程平台QODA

量子计算的编程框架也要统一了吗?


7 月 13 日,英伟达宣布了全新编程平台 NVIDIA Quantum Optimized Device Architecture(QODA,量子优化设备架构),旨在开发和管理在混合经典量子系统上运行的应用程序。QODA 将成为 cuQuantum,即英伟达 GPU 加速量子模拟系统的补充。与 cuQuantum 不同,QODA 旨在帮助人们在量子处理器和经典系统(GPU、CPU)组成的混合系统上开发和运行应用程序,使量子计算更易使用。

与 CUDA 类似,QODA 是开放的、统一的环境,后者适用于当今一些最强大的计算机和量子处理器,可提高科学生产力,并使量子研究具有更大的规模。

混合量子、经典计算的想法目前已被学界和业界广泛接受。QODA 的某些部分将更适合经典系统,而其他部分仅适用于量子计算机。我们可以至少部分地将 QODA 视为一组工具和一个编译器,其能够适当地划分任务,并将与量子相关的部分转换为各种量子处理器(QPU)的机器指令。

英伟达 HPC 和量子计算产品总监 Timothy Costa 在媒体活动中表示:「混合计算术语在行业中被过度使用了。应用程序中有一些算法最适合像 GPU 这样的经典计算资源,应以高性能方式实现以在 GPU 上运行。还有最适合量子计算机的算法。这些部分协同工作,数据则在其中来回传递。」

我们知道,当前的所有量子计算机都必须是混合的,经典计算机需要与 QPU 进行通信(即发送控制信号,解释结果),没有其他方法。



新平台的发布使英伟达的量子计算计划更加清晰。Costa 强调,英伟达没有进入 QPU 业务的计划。也就是说,这家公司清楚地将量子计算作为另一种加速器平台,并试图将其集成到 HPC 领域。利用 GPU 来加速混合量子经典应用程序是很自然的选择,在密集矩阵乘法等任务上,GPU 执行得比 QPU 更好。

QODA 将在 2022 年内推出,新产品面临的一个直接挑战是与许多不同类型的量子比特(离子阱、超导、光子等)进行通信。目前尚不清楚哪种 QPU 技术将占上风。

英伟达表示,一些领先的量子计算研究组织已经使用英伟达 GPU 和专业化软件 cuQuantum 来开发各自的量子线路。借助 QODA,开发者就能构建完整的量子应用程序,这些量子应用程序可以通过 cuQuantum 在 GPU 加速的超级计算机上进行模拟。

在 QODA 宣布的同时,英伟达宣布与五家量子硬件制造商合作。值得注意的是,每家制造商都使用了不同的量子比特技术。它们包括 IQM 量子计算机(超导量子比特)、Pasqal(中性原子)、Quantinuum(离子阱)、Quantum Brilliance(钻石中的氮空位)和 Xanadu(光子)。

「我需要强调这不是随机选择,」Costa 说道。「这是五种不同类型的量子比特,这对我们来说非常重要,因为我们正在选择第一批合作伙伴。我们希望确保在开发编程模型时不会遗漏任何东西,而这种模型是对一种量子比特进行编程所需的。我们期待在不久的将来扩大合作伙伴的范围。」

英伟达还宣布了与两家软件提供商 QC Ware 和 Zapata Computing 以及包括 Forschungszentrum Jülich、劳伦斯伯克利国家实验室和橡树岭国家实验室在内的几个超级计算中心合作。

英伟达是量子计算生态系统中相对后来的玩家。它对量子计算的推动始于 2021 年推出的 cuQuantum。Costa 表示,新产品 QODA 的目标是英伟达认为的市场空白。

「当今量子计算软件的大部分工作都集中在算法开发上,」Costa 表示。「因此与完全混合应用程序相比规模要小一些。目前一些较流行的框架,如 Cirq、Qiskit 和 PennyLane。它们非常重要,我们与 cuQuantum 一起发布的第一款产品就是为它们设计的,目的是让它们变得更强大。」

「基于算法实验的框架与构建当今用于量子计算的 GPU 加速科学应用程序之间存在很大差距,因为它们正朝着混合经典量子计算的方向发展。为此,我们需要从量子物理学家的算法开发过渡到领域科学家的应用程序开发,构建一个为混合量子经典计算设计的开发平台,提供与应用程序和编程范式互操作的性能,同时易于被科学家所使用。」

在寻求简化量子和混合量子经典资源的应用平台上,英伟达并不是唯一一家。例如,初创公司 Agnostiq 有一个开源产品 Covalent,旨在为包括量子资源的异构 HPC 环境开发工作流。

我们对于量子计算将如何融入 HPC 领域及成为生产力的形式并不明了。尽管情况正在迅速变化,但量子计算一直是人们努力的方向。英伟达的入局证明了这一点。

「众所周知,真正的量子优越性,即通过在应用程序中包含量子计算来与经典计算区分开来,通常出现在容错量子计算时代,数以百万计的量子比特将通过数千量子比特进行纠错。这还很遥远,还有很多工作要做。但很多不同领域的研究正在积极应对这一挑战,推动行业向前发展。全球有 22 个国家有量子计划,超过 70% 的领先科技公司都有量子计划,其中的规模和规模差异很大,但都是某种形式,每年都有很多论文,然后是 250 家或更多的初创公司,其中一些估值相当高,」Costa 说道。


当然,英伟达的发展重点是确保能在其 GPU 上运行量子计算工作时获得绝对最佳的性能。这就是 cuQuantum 在量子仿真方面的用途。因此,其提出的构建代码的方式 QODA 可以成为其他编译器的合作工具。「我们有编译器,NVC++ 是一个很好的例子。它既是加速器 GPU 编译器,又是高性能 CPU 编译器,你可以将其与 QODA 配对,Costa 说。

量子处理器(QPU)因为利用量子力学的特性,非常适合模拟原子级别的变化过程,有望推动化学、材料科学的基础进步,在从更高效的电池到更有效的药物等方面催生突破性进展。

QPU 还可以帮助解决物流等领域的棘手优化问题。在一项实验中,最近安装在于欧洲最大的量子计算设施之一,Jülich 量子计算统一基础设施(JUNIQ)的一台量子计算机展示了安排近 500 次航班的最有效方式,展示了该技术的潜力。

量子计算还有望将人工智能提升到一个新的水平。在单独的实验中,Jülich 研究人员使用量子机器学习来模拟蛋白质如何与 DNA 链结合并对法国里昂的卫星图像进行了分类。

「长期以来,我们一直认为混合系统是获得实用量子计算的唯一途径——与今天的经典 HPC 系统相关联,量子计算机将为我们提供两全其美的优势,」JUNIQ 负责人 Kristel Michielsen 表示。

英伟达 A100 GPU(绿色)构成了 JUWELS Booster 的核心,可以使用 cuQuantum 模拟量子任务。

与在 CPU 集群上运行的作业相比,研究人员应用通用量子计算机模拟器的 GPU 版本 JUQCS,获得了高达 49 倍的加速。

参考内容:https://www.hpcwire.com/2022/07/12/nvidia-dives-deeper-into-quantum-announces-qoda-programming-platform/https://blogs.nvidia.com/blog/2022/07/12/quantum-qoda-julich/

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
3天前
|
人工智能 自然语言处理 测试技术
英伟达最强通用大模型Nemotron-4登场
【2月更文挑战第13天】英伟达最强通用大模型Nemotron-4登场
55 2
英伟达最强通用大模型Nemotron-4登场
|
3天前
|
数据采集 算法 网络架构
英伟达开源大模型FoundationPose称霸BOP排行榜
【4月更文挑战第10天】英伟达新推出的FoundationPose模型在6D对象姿态估计和跟踪上取得重大突破,荣登BOP排行榜首。该模型以统一框架兼容有模型和无模型设置,利用大规模合成数据和对比学习提高泛化能力,且在复杂场景中表现出高适应性。尽管在处理某些困难情况时仍有局限,如无纹理物体的定位,但它展示了巨大的潜力和对未来技术的启示。
48 1
英伟达开源大模型FoundationPose称霸BOP排行榜
|
9月前
|
机器学习/深度学习 缓存 分布式计算
Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强
Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强
100 0
Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
首次英伟达Hopper基准测试
首次英伟达Hopper基准测试
|
机器学习/深度学习 存储 人工智能
MIT、哈佛新研究:提速15000倍,借助光场实现3D场景超高速渲染
MIT、哈佛新研究:提速15000倍,借助光场实现3D场景超高速渲染
|
机器学习/深度学习 人工智能 分布式计算
500亿晶体管,Dojo芯片细节发布!特斯拉ExaPOD将炼成「全球最快AI计算机」
上周特斯拉举办AI日,除了发布机器人,还公布了其自研的D1芯片。凭借这款芯片,特斯拉打造出了最快的 AI 训练计算机ExaPOD。
196 0
500亿晶体管,Dojo芯片细节发布!特斯拉ExaPOD将炼成「全球最快AI计算机」
|
机器学习/深度学习 存储 人工智能
MIT、哈佛新研究:提速15000倍,借助光场实现3D场景超高速渲染
MIT、哈佛新研究:提速15000倍,借助光场实现3D场景超高速渲染
127 0
MIT、哈佛新研究:提速15000倍,借助光场实现3D场景超高速渲染
|
编解码 Swift
英特尔发布首款独立显卡,目标内容创造者
11月1日,英特尔发布了Iris Xe Max独立显卡,这也是英特尔的第一款独立显卡,是一款面向笔记本的低功耗显卡,虽然看数据Xe Max并不非常显眼,基本就是Gen12 Xe核显的升级版,但经过评测后发现实力很强,远超MX250。
174 0
英特尔发布首款独立显卡,目标内容创造者
|
机器学习/深度学习 人工智能 自然语言处理
百度飞桨开发者已超190万,国内首个量子机器学习开发工具「量桨」面世
百度飞桨深度学习平台又有了大幅度的升级:飞桨企业版正式出炉,还有量子机器学习开发工具「量桨」发布。飞桨已成为国内首个,也是唯一支持量子机器学习的深度学习平台。
255 0
百度飞桨开发者已超190万,国内首个量子机器学习开发工具「量桨」面世
|
机器学习/深度学习 人工智能 并行计算
性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉
时隔三年,英伟达最强芯片 Tesla V100 有了继任者,20 倍的性能提升着实让人有些招架不住。
1032 0
性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉