关于量子计算机性能超越传统计算机这一关键转折点,计算机科学家有个专有名词,即“量子霸权”。从各方面来看,这样的转折点正在临近。
一般认为,能够处理49个量子位的量子计算机性能将可以匹敌全球最强大的超级计算机。如果量子计算机的规模进一步扩大,那么性能将远远超出传统计算机。
目前这还无法成为现实。一个重要问题在于,我们如何才能知道,这些量子计算机的工作是否符合期望。因此,计算机科学家开始利用强大的传统计算机去模拟量子计算机的行为。
这里的关键是在人类仍有能力的情况下,尽可能准确地测定量子计算机的行为。在此之后,我们只能完全信任量子世界所发生的一切。
当然,到目前为止,还没有任何人有能力模拟包含49个量子位的量子计算机。本周,瑞士苏黎世联邦理工学院的Thomas Haner和Damian Steiger公布了迄今为止目标最远大的一项实验计划。
研究团队利用了全球排名第五的超级计算机,模拟由45个量子位组成的量子计算机的行为。Haner和Steiger表示:“就我们所知,以模拟的量子位个数来看,这创造了新纪录。”他们也证明了,这样的模拟可以有多么强大。
由于量子计算机能够实现的计算复杂度,这样的模拟非常困难。量子计算机的计算能力来自叠加态这种量子现象,即一个量子微粒,例如光子,同时可以处于超过一种状态。
例如,水平极化的光子可以代表0,而垂直极化的光子可以代表1。但如果一个光子同时处于水平极化和垂直极化的叠加态,那么在计算中就可以同时代表0和1。
通过这种方式,2个光子可以代表4个数字,3个量子可以代表8个数字,以此类推。这就解释了为何量子计算机的计算能力如此强大,为何传统计算机的性能相形见绌。
例如,50个光子就可以代表10的16次方个数字,而传统计算机需要1PB(1024TB)规模的内存,才能存储这些数字。
在传统计算机中处理这些数据则是规模更大的任务。这是由于,大部分超级计算机由多个处理单元组成,这些处理单元通过相互连接形成计算网络。因此,管理不同节点之间的数据流将造成巨大的通信负荷。
这样的挑战限制了传统计算机模拟量子计算机的规模。目前的世界纪录是模拟42个量子位,这一成就是Julich超级计算机在2010年取得的。自那时以来,由于计算负荷的问题,这方面未能取得太大进展。
由于Haner和Steiger的工作,这样的情况将发生改变。他们的突破在于寻找多种方式去降低计算负荷,使模拟速度比以往提升至少1个数量级。
研究人员已在加州劳伦斯伯克利国家实验室Cori II超级计算机的一系列模拟中应用了这些技术。这台超级计算机包含9304个节点,每个节点都包含68核英特尔至强Phi 7250处理器,运行频率为1.4GHz。峰值性能为每秒29.1千万亿次浮点运算,内存则为1PB。
这台超级计算机以首位女性诺贝尔医学奖得主Gerty Cori来命名,是全球排名第五的超级计算机。
Haner和Steiger使用这台超级计算机模拟了包含30、36、42和45个量子位的量子计算机。在规模最大的一次模拟中,他们使用了0.5PB的内存和8192个节点,实现的性能为每秒0.428千万亿次浮点运算。
这距离发挥Cori II超级计算机的峰值性能还有很大差距。研究团队表示,这是由于大量计算性能都被用于处理通信负荷,而通信负荷仍占据了75%的计算时间。
Haner和Steiger比较了在性能较弱的超级计算机Edsion上,对30和36个量子位进行模拟的结果。这台超级计算机同样属于劳伦斯伯克利实验室。他们发现,他们的方法同样可以加速计算。“这表明,实现的速度提升并不仅仅是启用新一代硬件(即Cori II超级计算机)的结果。”
他们认为,这样的技术进步表明,对49个量子位的模拟将在不久的将来实现。
这方面的工作将为未来量子计算机的发展铺平道路。其中获得的数据将扮演重要角色,使物理学家能够知道,当“量子霸权”最终到来时,量子计算究竟有多么强大。毫无疑问,这一天不会太远。
相关论文
《0.5 Petabyte Simulation of a 45-Qubit Quantum Circuit》
摘要:
Near-term quantum computers will soon reach sizes that are challenging to directly simulate, even when employing the most powerful supercomputers. Yet, the ability to simulate these early devices using classical computers is crucial for calibration, validation, and benchmarking. In order to make use of the full potential of systems featuring multi- and many-core processors, we use automatic code generation and optimization of compute kernels, which also enables performance portability. We apply a scheduling algorithm to quantum supremacy circuits in order to reduce the required communication and simulate a 45-qubit circuit on the Cori II supercomputer using 8,192 nodes and 0.5 petabytes of memory. To our knowledge, this constitutes the largest quantum circuit simulation to this date. Our highly-tuned kernels in combination with the reduced communication requirements allow an improvement in time-to-solution over state-of-the-art simulators by more than an order of magnitude at every scale.
论文地址:https://arxiv.org/abs/1704.01127
PDF版本可在量子位微信公众号回复:“45”这个数字下载。