别太得意。
当你试图了解宇宙的时候,宇宙也在「学习」你。
近日,与微软合作的一组理论物理学家发表了一篇惊人的论文,将宇宙描述为:进化定律的自学成才系统(a self-learning system of evolutionary laws)。
这篇长达80页的论文名为「自律宇宙(The Autodidactic Universe)」,论文表示,和人类一样,宇宙本身也在观察并学习自己的规律与结构,并因此作出某些改变。
换句话说,我们生活在一台不断学习自身的电脑里。
宇宙自学成才,「演化」出深度学习框架?
如果宇宙是一台计算机,而不是固态的存在,那么它是怎么运作的?
论文指出,宇宙的运行有一个类似于机器学习的学习系统。
正如我们教会机器来执行某些功能一样,本质上,宇宙法则是以学习操作的形式工作的算法。
根据作者的观点,宇宙也演化出了类似深度学习框架的自发系统。
我们知道,深度学习框架就是一套积木,各个组件就是某个模型或算法的一部分,你可以自己设计积木的堆叠。
因此,我们是否可以想象,宇宙演化出法则的操作矩阵架构,其本身是从一个自动教学系统演化而来的,该系统产生于最可能的最小初始条件?
论文中,作者描述了几个模型,这些模型均实现了「自导自演」:
有7,088个节点和7,304条边的图,由抽样可能的未来构成
仔细想想,这是有道理的。
生活中,物理定律的得出靠的是我们的观察,所以原始物理定律将极其简单,但经过代代更迭,定律有了自我延续并具有学习和发展的能力。
也许,宇宙不是从大爆炸开始的,而仅仅是粒子之间的简单相互作用。
研究人员通过指出「架构会放大放大很小数量的粒子的因果关系」来暗示这一渊源。
宇宙定律不断更新,过程不可逆,统一物理学不可能!
作者认为,宇宙不断发展的规律不可逆转。
这是因为新的状态不是随机的,而是必须满足一定的约束条件,而眼前的过去状态已经满足了约束条件。
「规律恢复到以前的状态是很常见的,甚至可能比它们找到新的状态更有可能。」
论文第一作者Stephon Alexander
一个可逆但不断进化的系统会随机地频繁地探索离它最近的过去。当我们看到一个不断进化的系统表现出稳定期时,它可能是单向进化的。
在说明这些观点时,研究人员引用了一个例子:
你可以简单地检查一下硬盘上剩余的磁性标记。这样就会发现程序的结果是可逆的:因为存在之前执行的历史记录。
但是,如果同一位专家试图通过检查CPU来确定程序的结果,那就很难做。因为没有CPU的运行记录。
根据这篇论文,138亿年前和100万亿年后,支配相对论等概念的规则可能完全不同。
这意味着物理学并不是一成不变的。
用物理思维理解机器学习
文章围绕受限玻尔兹曼机(restricted Boltzmann machine, RBM)讨论。
受限玻尔兹曼机由Hinton等人提出,是一种生成式随机神经网络。
这个概念非常抽象,是一种类似物理学的机器学习模型。
然而,受限玻尔兹曼机是最简单的一类深度神经网络结构,
该架构由两层神经元组成。一个是可见层(绿色),一个是隐藏层(蓝色)。
在这种模型中,神经元的状态值是以随机的方式确定的,而不像之前介绍的神经网络那样是确定性的。据任务的不同,受限玻兹曼机可以使用监督学习或无监督学习的方法进行训练。
简单理解,就是做个映射,其规律可能会随着时间的推移而演变。
那么,如何将物理规律理解为学习?
作者将建立以下的图谱,在一类物理理论和一类基于神经网络的学习模型。
模拟理论(上)、规范场论(左)与机器学习(右)
然后通过与矩阵模型的对应关系来实现:
随着训练过程的迭代,连接两层的权重会根据优先原则进行更新,直到它们在某个极限集上收敛。但作者考虑的变体情况是,两层的size都非常大,而且每层的神经元数量相等。
模拟矩阵的「信徒」:从德雷克方程到马斯克
熟悉马斯克的都知道,他坚信「矩阵模拟假设(Matrix-style simulation)」。
2018年,在由喜剧演员Joe Rogan主持的《The Joe Rogan Experience》节目中,马斯克比较全面的阐述了他自己的价值观,他坚信「我们活在模拟(simulation)中」。马斯克的「矩阵模拟假设(Matrix-style simulation)」理论是根据宇宙已经存在138亿年的事实而提出来的。
让我们引入另一个概念:德雷克方程。
德雷克方程是科学界最著名的研究成果之一,它通过估计我们银河系中可能存在的其他智慧文明的数量,计算出我们在宇宙中并不孤单的可能性。 德雷克公式又称「绿岸公式」,是用来推算银河系及可观测宇宙能与我们进行无线电通信的高智能文明数目。由美国天文学家德雷克于1960年代在绿岸镇提出。
雷克方程