時隔四個月,ByteDance Research 與北京大學物理學院陳基主題組又一合作工作登上國際頂級刊物 Nature Communications:論文《 Towards the ground state of molecules via diffusion Monte Carlo on neural networks 》將神經網路與擴散蒙特卡羅方法結合,大幅提升神經網路方法在量子化學相關任務上的計算精度、效率以及體系規模,成為最新SOTA。
擴散蒙特卡羅方法是量子化學領域精確計算分子和材料基態能量的常用方法之一。透過與擴散蒙特卡羅方法結合,作者顯著提高了量子化學中神經網路 SOTA 方法的計算精度與效率。此外作者也提出了一種基於經驗線性關係的外推方法,大幅改善了分子結合能計算。總體而言,此計算框架作為求解量子多體問題的高精度方法,為化學分子性質的深入理解提供了更強大的工具。
基於神經網路的量子蒙特卡羅方法
#2018 年以來,多個研究小組將神經網路運用於變分蒙特卡羅方法(Variational Monte Carlo, or VMC) 中[1,2,3],借助神經網路強大的表達能力,得到了更為精確的分子基態能量。當本工作在 2022 年公開時,基於神經網路的變分蒙特卡羅方法中的 SOTA 工作是 DeepMind 於 2019 年提出的 FermiNet [2],能夠在規模較小的系統上得到非常精確的結果。然而變分蒙特卡羅方法的精確度受限於神經網路的表達能力,在處理較大體系時會有越來越明顯的精確度問題。此外該類方法在處理較大體系時收斂非常緩慢,對計算資源提出了巨大挑戰。擴散蒙特卡羅方法作為量子化學領域的經典高精度演算法之一,具有精度高、可並行性好、適合進行大規模計算等良好的特性。此外擴散蒙特卡羅可以突破神經網路的表達能力限制,利用投影演算法超越變分蒙特卡羅方法的精確度。
本工作中,作者將 SOTA 的神經網路 (FermiNet) 作為試探波函數與擴散蒙特卡羅方法結合。新的計算方法相比於 FermiNet 顯著提升了精度並減少了所需的計算步數。本工作中所設計並實現的擴散蒙特卡羅軟體具有神經網路友善、GPU 友善、平行友善的特點,可與廣泛的神經網路波函數結合,自動提升其精度與效率。
計算結果
1.原子
#使用神經網路對大型分子體系進行量子蒙特卡洛計算時,由於算力限制,所能使用的神經網路的表達能力也會受到一定限制。為了模擬這一場景,作者使用了僅僅兩層的神經網路來研究第二、三排的原子。計算結果顯示隨著體系變大,變分蒙特卡羅方法的精度愈來愈差,而擴散蒙特卡羅方法所帶來的精度提升也愈來愈明顯。
2.分子 作者在一系列分子体系上也验证了基于神经网络的扩散蒙特卡洛方法的有效性,包括氮气分子,环丁二烯以及双水分子。在所测试的体系上均观察到了明显的计算精度提升。 3. 苯环及双苯环 本工作公开前,量子化学领域中基于变分蒙特卡洛的神经网络波函数方法只处理过 30 电子以内的小型分子。本工作首次将神经网络波函数方法应用于 42~84 个电子的体系,即苯环与双苯环。计算结果显示,扩散蒙特卡洛方法在精度上显著优于变分蒙特卡洛方法,同时可以用少一个数量级的计算步数达到相同或更优的精度。
4. 线性关系及外推方法
作者在考察神经网络的不同训练阶段所对应的能量时,在很多体系上均发现变分蒙特卡洛与扩散蒙特卡洛的计算结果具有经验性的线性关系(下左图)。使用该线性关系对双苯环的解离能计算进行外推,显著提升了计算精度,得到了吻合于化学实验的结果(下右图)。
本工作表明,基于神经网络的扩散蒙特卡洛方法在精度与效率上均优于变分蒙特卡洛方法。作者开源的扩散蒙特卡洛代码可以与量子化学领域不断推陈出新的神经网络 [4,5] 快速结合,实现对研究社区的赋能。此外扩散蒙特卡洛方法也可以与处理真实固体的周期性神经网络 [6]、带赝势的神经网络 [7] 等一系列方法结合,在相应任务上提升计算效果。
以上是新研究揭示量子蒙特卡洛超越神經網路在突破限制的潛力,Nature子刊詳述最新進展的詳細內容。更多資訊請關注PHP中文網其他相關文章!