量子计算机可以解决传统计算机无法完成的复杂任务。然而,量子态(quantum states)对来自外界的持续干扰极其敏感。研究人员希望使用基于量子纠错(quantum error correction)的主动保护来解决这个问题。
近日,德国马克斯·普朗克光学研究所所长Florian Marquardt及其团队在物理期刊physical review X上发表论文Reinforcement Learning with Neural Networks for Quantum Feedback,提出一种基于人工智能算法的量子纠错系统。
2016年,人工智能程序AlphaGo在围棋比赛中击败了世界上最强的人类棋手,举世瞩目。鉴于一局围棋中的移动组合比估计的宇宙中的原子的数量更多,它需要的不仅仅是处理能力。相反,AlphaGo利用了人工神经网络,它可以识别视觉模式,甚至能够学习。与人类不同,AlphaGo能够在短时间内练习下数十万局围棋,最终得以超越最优秀的人类棋手。
马克斯·普朗克研究所的研究人员正试图利用这种神经网络为量子计算机开发纠错学习的系统。
人工神经网络是一种模拟相互连接的神经细胞(神经元)行为的计算机程序——在这项研究中,大约有2000人工神经元相互连接。
“我们从计算机科学中获取最新的想法,并将其应用到物理系统,”Florian Marquardt说:“这样,我们可以从快速进步的AI领域获益。”
学习量子纠错:神经网络在执行任务时,人工神经元活动的可视化
图片来源:马克斯普朗克光学研究所
该研究的主要想法可以概括为一下几点:
人工神经网络或能够超过其他纠错策略
在论文中,该团队证明了人工神经网络能够自我学习如何执行一项对未来量子计算机操作至关重要的任务——量子纠错。甚至通过足够的训练,这种方法有望超过其他纠错策略。
为了理解它的工作原理,首先需要了解量子计算机的工作方式。量子信息的基础是量子比特(quantum bit,或qubit)。与传统的数字比特不同,量子比特不仅可以采用0和1两个态,而且可以采用两种态的叠加。
在量子计算机的处理器中,甚至有多个量子比特作为联合态的一部分叠加在一起。这种纠缠让量子计算机具有解决某些复杂任务的强大处理能力,而这些任务是传统计算机毫无办法的。
但是,量子信息对环境噪声非常敏感。量子世界的这一特性意味着量子信息需要定期修正——即量子纠错。然而,量子纠错需要的操作不仅复杂,而且必须要保持量子信息本身的完整。
量子纠错就像一场规则奇特的围棋游戏
Marquardt在介绍该研究的工作原理时提出了一个有趣的类比,他说:“你可以把量子计算机的元素想象成一块围棋棋盘,量子比特像棋子一样分布在整个棋盘上。”但是,与传统的围棋游戏相比有一些关键的区别:所有棋子都已经排列在棋盘上,而且每一枚棋子都是一面是白色一面黑色。一种颜色对应0,另一种颜色对应1,并且量子围棋游戏中的移动相当于将棋子翻过来。根据量子世界的规则,棋子也可以是黑白混合在一起的灰色——代表量子态的叠加和纠缠。
在玩这个量子围棋游戏时,玩家——让我们称她为Alice——做出的动作是为了保留代表某种量子态的模式。这就是量子纠错操作。与此同时,她的对手竭尽全力摧毁这种模式。这代表实际的量子比特在其环境中经受的过多干扰的持续噪声。此外,量子围棋游戏难度特别大,因为还有一条特殊的量子规则:Alice是不允许看到棋盘的。只要一瞥见任何能揭示量子比特状态的场景,都会摧毁游戏目前敏感的量子状态。
问题是:在这么多限制下,她如何才能做出正确的举动?
辅助量子比特揭示了量子计算机中的缺陷
在量子计算机中,这个问题是通过在存储实际量子信息的量子比特之间定位额外量子比特来解决的。可以采取间断的测量来监视这些辅助量子比特的状态,允许量子计算机的控制器识别故障所在的位置,并对这些区域中携带信息的量子比特执行纠错操作。
在作为类比的量子围棋游戏中,辅助量子比特由在实际游戏棋子之间分布的辅助棋子来表示。Alice可以偶尔看一眼,但只能看这些辅助棋子。
在这个研究中,Alice的角色由人工神经网络完成。研究人员的想法是,通过训练,网络将变得非常擅长这个角色,甚至可以超越人类所设计的纠正策略。
然而,当该团队研究一个包含五个模拟量子比特的例子时,他们发现仅用一个人工神经网络是不够的。由于网络只能收集关于量子比特状态的少量信息,它永远无法超越随机试错的策略。最终,这些尝试破坏了量子态,而不是纠正它。
一个神经网络使用它的先验知识来训练另一个神经网络
解决方案是加一个额外的神经网络,作为第一个网络的教师(teacher)。凭借其对量子计算机的先验知识,该教师网络能够训练其他网络——也就是它的学生——从而引导网络成功地进行量子纠错。但是,首先,教师网络本身需要充分了解量子计算机或需要控制的量子计算机组件。
原则上,人工神经网络使用奖励系统进行训练。对于量子纠错系统,要成功恢复原始量子态,实际的奖励是必要的。
“然而,如果在实现这个长期目标后再给予奖励,它需要尝试许多次纠错,实现目标需要的时间太长,”Marquardt解释说。
因此,他们开发了一种奖励系统,即在训练阶段也能激励教师神经网络采用有效的策略。在量子围棋游戏中,这个奖励系统将为Alice提供给定时间内游戏的总体状态,但不泄露细节。
学生网络可以通过自己的行动超越老师
“我们的第一个目标是让教师网络学会在没有人工协助的情况下成功地实现量子纠错操作,”Marquardt说。与学生网络不同,教师网络不仅可以基于测量结果,还可以基于计算机的整体量子状态来做到这一点。由教师网络训练的学生网络一开始会变得同样好,但通过自己的行为,可以变得更好。
除了量子计算机中的纠错之外,Florian Marquardt还设想了人工智能的其他应用。在他看来,物理学提供了许多系统,可以受益于人工神经网络的模式识别。
原文发布时间为:2018-10-30
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。