DeepMind最新成果剑指量子力学，FermiNet或将破解近百年计算难题-51CTO.COM

继AlphaFold 3掀起生物学革命后，DeepMind又要开始发力量子力学了。

8月22日，他们最新的研究成果FermiNet登上了Science，使用神经网络对量子激发态进行准确计算。

论文地址：https://www.science.org/doi/abs/10.1126/science.adn0137

而是将问题转化为寻找扩展系统的基态问题。论文介绍了一种通过变分蒙特卡罗（variational Monte Carlo）估计量子系统激发态的算法，而是将问题转化为寻找扩展系统基态的问题，因此非常适用于神经网络分析。

通过在两种不同的神经网络：FermiNet和Psiformer上运行，作者验证了这种方法的准确性。

其中FerminNet同样由DeepMind和帝国理工学院于2020年联名提出，论文发表在期刊《Physical Review Research》上。

论文地址：https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429

这篇论文展示了深度学习如何帮助求解量子力学基本方程，提出的创新网络架构FermiNet非常适合对大量电子集合（即化学键的基本构建块）的量子态进行建模。

更重要的是，FermiNet首次展示了，如何用深度学习方法、根据第一性原理计算原子和分子的能量，其准确度足以发挥实际作用。

这不仅是一个重要的基础科学问题，而且还可能在未来产生实际用途，比如在制造新材料和化学合成物之前，使用计算机进行模拟或原型制作。

此外，FermiNet在蛋白质折叠、玻璃动力学、晶格量子色动力学等领域都可能有广泛的用途。

FeimiNet相关代码已经公布在GitHub上，方便计算物理和计算化学领域相关研究的参考。

仓库地址：https://github.com/google-deepmind/ferminet

除了FermiNet，DeepMind在2022年发布的基于自注意力的架构Psiformer仍然是迄今为止用于求解量子力学方程的最准确的AI方法。

论文地址：https://arxiv.org/abs/2211.13672

量子力学简史

没有什么比「量子力学」这四个字更能让人困惑的了，毕竟这是让普朗克都为之头秃的领域。

比如薛定谔思维实验里那只又死又活的猫，还有经典物理完全无法描述的——粒子和波的性质同时存在。

https://www.livescience.com/24509-light-wave-particle-duality-experiment.html

在经典模型中，原子核位于中间，固定数量的电子绕着固定的轨道运行，如同太阳系一般严谨有序。

但在量子系统中，电子等粒子完全没有这种精确的轨道，它们的位置是由「概率云」描述的。

「概率云」是什么意思？

这个模型告诉我们，原子中的电子没有固定的运动轨迹，也没有确切的位置，只能用「电子概率密度」描述它们在某个区域出现的概率。

然而，概率云模型给我们的仅仅是「概率」而已，无法真正判断电子在任何特定时刻是否位于某个区域。

https://www.sciencefacts.net/electron-cloud.html

这种情况已经超出了一般人类能理解的范畴，因此著名物理学家Richard Feynman才会宣称：「如果你认为自己理解量子力学，那你就根本不理解量子力学。」

虽然直觉无法理解，语言解释起来也很困难，但是理论的核心内容可以用非常简洁的数学语言描述。

所以计算机科学领域常听到的「Talk is cheap, show me your code」，在理论物理也有类似的一句话——「Shut up and calculate」。

在核心的几个方程中，最著名的是薛定谔方程，足以描述所有熟悉物质在原子和原子核水平上的行为。

https://abakcus.com/directory/schrodingers-equation/

化学中的共价键，或者超导体、超流体、激光和半导体的各种反直觉性质，都是电子间量子相互作用的结果，也都可以用薛定谔方程来描述。

上世纪20年代，量子力学的相关规则出现后，科学家们第一次可以用详细理论描述化学反应的最底层原理。

比如，对不同分子建立相应方程，求解系统的能量，就可以找出哪些分子处于稳定态，哪些分子间会自发地发生反应。

然而，理想很美好，现实很骨感。

当科学家们实际开始计算时，他们发现，只有氢原子的方程可以求解——其他的都太复杂了，算不出来。

因此，量子力学奠基人之一、物理学家Paul Dirac在1929年说了这样一句话，到今天依旧适用——

「要描述大部分物理学和整个化学的数学理论，所必需的基本物理定律是完全已知的。困难只在于，要精确应用这些定律的话，会导致方程过于复杂而无法求解。」

「所以，我们需要开发能应用量子力学的近似方法。」

Dirac之后，物理学家使用了一种近似方法，将电子分配到一个特定的轨道，每个轨道的形状由所有其他轨道平均得到。

这种「平均场」方法只给每个电子分配一个轨道，因此对电子实际行为的描述非常不完整，但依然是一个可行的方法，对分子总能量的估算误差在0.5%左右

原子轨道示意图，蓝色或紫色区域的表面表示最有可能找到电子的区域；蓝色区域波函数为正，紫色区域波函数为负

然而，误差为0.5%的方法依旧不够。

要知道，分子键能量仅仅占系统总能量中的微小部分，想正确预测分子是否处于稳定态，要依靠占比0.001%的能量差值来判断，或剩余相关能量中的0.02%。

相比电子平均场，近几十年开发的多种计算方法都取得了进步，但总是不能在同时达到令人满意的准确率和计算效率。

为费米子量身定做神经网络

表示量子系统的挑战之处在于，必需为每种可能的电子位置分配相应概率，这就构成了一个极其庞大的构型空间。

比如，单单是硅原子，其可能的电子构型数量就会比宇宙中所有原子的数量加起来还要多。而这正是深度神经网络的用武之地。

过去几年中，神经网络在表示复杂的高维概率分布方面取得了巨大的进步，而且能以有效、可扩展的方式进行训练。它们在AI领域中拟合高维函数的能力，或许也能用于表示量子的波函数。

泡利不相容原理

处理电子时，还需要考虑一个问题——电子必须遵守泡利不相容原理（Pauli exclusion principle），这意味着它们不能同时处于同一空间。

因为电子属于「费米子」，其波函数必须是反对称（antisymmetric）的。如果交换两个电子的位置，波函数就会乘以-1。这意味着如果两个电子彼此重叠，则波函数（以及该构型的概率）将为零。

这意味着我们需要开发一种新的神经网络，接受反对称结构的输入——这就是FermiNet。

矩阵的行列式恰好具有这种「反对称」属性：如果交换两行，输出就会乘以-1，就像费米子的波函数一样。因此在大多数量子化学方法中，「反对称性」是通过行列式引入的。

Slater行列式就采用了这种思路：使用单电子函数对系统中的每个电子进行评估，并将所有结果打包到一个矩阵中，该矩阵的行列式就是反对称波函数。

Slater行列式的动画演示：每条曲线都是上面所示轨道之一的切片当，电子1和2交换位置时，对应于Slater行列式发生行交换，波函数乘以-1，保证遵循泡利不相容原理

在表示复杂函数方面，深度神经网络通常比基函数的线性组合更有效。

在FermiNet中，进入行列式的每个函数都是所有电子的函数，这远远超出了仅使用单个电子或两个电子构建函数的方法（如Slater行列式）。

此外，FermiNet中每个电子都对应单独的信息流。但如果这些流之间没有任何交互，FermiNet的表达能力也不会比Slater行列式有所提升。

因此，网络中每一层所有流的信息都被平均后，才会传递到下一层的信息流中，这类似于图神经网络在每一层聚合信息的方式。

因此，与Slater行列式不同，如果神经网络层变得足够宽，FermiNet就可以作为通用函数逼近器。这意味着，如果得到正确训练，FermiNet就能够拟合薛定谔方程的近似精确解。

FermiNet的动画演示：网络的单个流（蓝色、紫色或粉色）的功能与传统轨道非常相似。FermiNet引入了流之间的对称交互，使波函数更加通用、表达能力更强，且保留了Slater行列式的反对称特性

变分量子蒙特卡罗

如果要准确地通过最小化系统能量来拟合FermiNet，就需要评估所有可能出现的电子构型的波函数。显然，我们不能直接计算其精确值，只能估算其近似值。

我们随机选择电子配置，评估每种电子排布的局部能量，将其相加后进行最小化。

与直接计算真实的能量最小值不同，这种估算方法被称为蒙特卡罗方法（Monte Carlo method），有点像赌徒一遍又一遍地掷骰子。虽然得到的只是近似值，但如果需要使其更精确，我们随时可以再次掷骰子。

这些电子排布的样本从何而来呢？

由于波函数的平方给出了在任何位置观察到某种特定粒子排布的概率，因此从波函数本身生成样本是最方便的——本质上是模拟观察粒子的行为。

虽然大多数神经网络根据外部数据进行训练，但在FermiNet中，用于训练的输入数据由神经网络本身生成的。这意味着，除了指定原子核的结构和位置，我们不需要任何额外的训练数据。

这种思想被称为「变分量子蒙特卡罗」（variational quantum Monte Carlo, VMC）。虽然60年代就被提出，但通常被认为是一种低成本且不精确的计算方法。

通过用FermiNet替换Slater行列式，VMC成功「改头换面」，准确率得到了极大的提升。

从FermiNet采样：模拟电子围绕双环丁烷分子移动

实验结果

我们首先从简单的、经过充分研究的系统开始：元素周期表第一行中的原子（氢到氖）。

这些都是小型系统，电子数≤10个，而且足够简单——甚至简单到可以用最准确且最昂贵（指数扩展）的方法来处理它们。

结果发现，FermiNet的性能远远优于类似的VMC方法——相对于计算量以指数级别增长的方法，误差通常能降低一半或更多。

在较大的系统上，指数扩展的方法过于复杂，因此使用耦合聚类方法（coupled cluster method）作为基线。

耦合聚类方法对于稳定构型的分子效果很好，但很难应对化学键拉伸或断裂时的情况，而后者对于理解化学反应恰恰至关重要。

另外，虽然这种方法的计算效率比指数扩展的方法要好得多，但实验所用方法的计算量仍以电子数量的七次方的速度增加，因此也只能用于中等大小的分子。

下一阶段，将FermiNet应用于逐渐变大的分子，从氢化锂到双环丁烷。

对于最小的分子，FermiNet捕获了耦合簇能量和单个Slater行列式获得的能量之间的99.8%的差异。

双环丁烷是我们研究过的最大的系统，有 30 个电子，FermiNet仍然捕获了97%或更多的相关能量（correlation energy），考虑到我们应用的方法非常简单，这是一个巨大的成就。

FermiNet在分子上捕获的相关能量比例：紫色表示99%的相关能量，从左到右：氢化锂、氮气、乙烯、臭氧、乙醇和双环丁烷。

计算激发态的新方法

除了2020年提出的FermiNet，在Science上最新发表的成果中，DeepMind为计算量子化学领域中最困难挑战之一提出了解决方案——了解分子如何在激发态之间转变。

FermiNet最初专注于分子的基态，即给定一组原子核，找到其周围电子的最低能量排布。

但是，当分子和材料受到大量能量的激发时，例如光照或高温，电子可能会进入更高的能量状态——激发态。

激发态是理解物质与光相互作用的基础，不同的分子和材料会吸收/释放确切数量的能量，这相当于它们独特的指纹。

对这方面原理的理解影响着太阳能电池板、LED、半导体、光催化剂等技术的性能，也在涉及光的生物过程中发挥着关键作用，例如光合作用和视觉。

准确计算激发态能量比计算基态能量更具挑战性。即使是基态化学的黄金基准方法，如上面提到的耦合簇，在计算激发态能量时也会有大数十倍的误差。

虽然我们希望将FermiNet的工作扩展到激发态，但目前来看，神经网络还不能与与最先进的方法竞争。

因此，这篇论文提出了一种计算激发态的新方法，比以前的方法更强大、更通用，可以应用于任何类型的数学模型，包括FermiNet和其他神经网络。

其工作原理是找到具有额外粒子的扩展系统的基态，因此对现有的优化算法进行少量修改即可使用。

论文在广泛的基准上进行了验证，并取得了非常理想的实验结果。carbon dimer

在双原子碳（carbon dimer）这种小而复杂的分子上，该方法实现了4meV的平均绝对误差 (MAE)，而之前的gold standard方法，误差为20meV，相当于五倍更接近实验结果。

双原子碳示意图

此外，作者还在计算化学中一些最具挑战性的系统上进行了测试，比如两个电子同时被激发。结果发现。与迄今为止完成的最苛刻、最复杂的计算相比，误差仅在0.1 eV。