Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！-人工智慧-PHP中文網

本文由Cristian Bodnar 和Fabrizio Frasca 合著，以 C. Bodnar 、F. Frasca 等人发表于2021 ICML《Weisfeiler and Lehman Go Topological: 信息传递简单网络》和2021 NeurIPS 《Weisfeiler and Lehman Go Cellular: CW 网络》论文为参考。

本文仅是通过微分几何学和代数拓扑学的视角讨论图神经网络系列的部分内容。

从计算机网络到大型强子对撞机中的粒子相互作用，图可以用来模拟任何东西。图之所以无处不在，是因为它们具有离散性和组合性，这使得它们能够表达抽象关系，同时又易于计算。它们受欢迎的原因之一是图抽象出几何图形，即节点在空间中的位置或边缘是如何弯曲的，只留下节点如何连接的表示。

图论起源于莱昂哈德 · 欧拉（Leonhard Euler）在1741年的著作《geometria situs》中的观察，他指出著名的柯尼斯堡七桥问题问题没有解决方案。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

图注：七桥问题要求在哥尼斯堡市内找到一条循环行走的路线，不需要多次过桥。正如欧拉所说，哥尼斯堡市的确切形状并不重要，重要的是不同的土地（图的节点）是如何相互连接的（边）。欧拉表明，当且仅当所有节点具有偶数度时，这样的循环才存在。另外，最初的桥梁中只有五座存活到现代。图源：维基百科

有趣的是，欧拉的发现不仅标志着图论的开始，而且也常常被认为是拓扑学诞生的标志。与图一样，拓扑学家对空间的那些与其特定形状或几何形状无关的属性感兴趣。

这些思想的现代表现形式出现在1895年的“分析地点” （Analysis situs），这是 Henri Poincaré 的一篇开创性的论文，他的工作点燃了对流形的组合描述的兴趣，从这些流形中可以更容易地找到和计算拓扑不变量。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

图注：Leonhard Euler（1707-1783）和 Henri Poincaré（1854-1912）

这些组合描述今天被称为细胞复合体，可以被认为是图的高维概括。

与由节点和边形成的图不同，细胞复合体也可以包含更高维的结构或“细胞”：顶点是0-细胞，边是1-细胞，2D 表面是2-细胞等。为了构建一个细胞复合体，我们可以通过将一个细胞的边界粘合到其他低维细胞上来进行分层。

在特殊情况下，当单元格由单形（如边、三角形、四面体等）构成时，这些空间也称为单形复合体。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

图注：图可以看作是我们附加边（1-单元格）的一组顶点。类似地，单细胞复合体和细胞复合体可以看作是我们连接2-细胞（蓝色显示）、3-细胞（绿色显示）等的图形。

1 机器学习与数据科学中的拓扑

我们认为，人们不必等待 400 年才将把拓扑学变成一种实用的工具。

在拓扑数据分析（TDA）的保护伞下，诸如浅层复合物这样的拓扑结构已经被用于机器学习和数据科学，这类方法出现在20世纪90年代，试图以一种对度量不敏感和对噪声稳健的方式来分析“数据的形状”。

TDA的根源可以追溯到20世紀20年代末最多產的拓撲學家之一 Leopold Vietnam oris 的工作。然而，這些技術必須等到現代計算的誕生才能大規模應用。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：給定一個點雲，每個點周圍固定半徑的封閉球之間的交叉點產生一個簡單的複合體。透過逐步增加球的半徑，我們可以得到一個嵌套的簡單複合體序列。圖源：Bastian Rieck。

TDA 的主力是持久性同源性（PH），一種從點雲中提取拓樸特徵的方法。給定一個點的資料集，PH 建立一個簡單複數的巢狀序列，其中每個複數對應於分析基礎點雲的某個比例。然後，它追蹤各種拓撲特徵（例如，連接的組件、循環或空洞），這些特徵隨著比例的逐漸增加而出現和消失，並且人們從序列中的一個複合物過渡到下一個複合物。

在深度學習時代，持久性同源性有了“第二次生命”，因為它表明人們可以通過它進行反向傳播，從而允許將已經建立的TDA 設備整合到深度學習框架中。

最近的一系列工作提出了在幾何深度學習中簡化和細胞複合體的不同用途，作為一個更豐富的底層拓撲空間來支持數據和對其進行的計算。

最早利用這一觀點的幾項工作提出了卷積模型以及在簡化複合體上操作的隨機行走方法。如在本文中，卷積模型可以被理解為簡單和細胞複合體上訊息傳遞的具體實例。

由於計算是由這些空間的拓樸（即鄰域結構）所驅動的，我們把這套方法稱為拓樸資訊傳遞。在這個框架中，相鄰的單元，可能是不同維度的，正在交換訊息，如下圖所示。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：拓樸資訊傳遞示意圖。藍色箭頭描述了上層相鄰細胞之間的「水平」訊息傳播，即同一高維細胞的邊界上的細胞。紅色箭頭描述了「垂直」訊息傳播，即細胞從其邊界的低維細胞中接收訊息。將來自邊界細胞的資訊匯總到一個更粗的表示中，這種計算可以被解釋為一種（可微分的）集合形式。

在GNN 中超越圖

儘管細胞複合體提供了豐富的結構，但我們不能忽視圖是迄今為止機器學習中最常見的拓樸對象，而且很少有資料集能超越它們。儘管如此，人們仍然可以透過轉換輸入圖來利用這些有趣的拓樸空間。

我們把圖轉換為高維拓撲空間稱為“提升”，以類似於範疇理論中的同名概念。它是一種轉換，透過遵循某些規則將高維單元附加到輸入圖上。例如，一個圖可以透過在圖的每個懸崖或週期上附加一個高維單元而被提升為一個單元複合體。透過這樣做，圖被替換成一個不同的空間，它有更多的結構，可以為GNN提供一個比原始圖更好的計算結構。在下文中，我們將討論這種方法的具體優勢。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：透過將二維封閉圓盤的邊界黏合到圖中的誘導循環上，可以從圖中構造出高維度的細胞複合體。

高階特徵和結構

GNN通常採用以節點為中心的觀點，駐留在邊上的資料僅被視為增加頂點間通訊的輔助資訊。在拓樸訊息傳遞中，所有單元都是一等公民。無論它們的維度如何，它們都被分配了一個特定的表示，這個表示是透過與相鄰的單元交換資訊而發展起來的。這為明確地模擬某些高階結構和它們之間的相互作用提供了一個秘訣。特別是，它提供了一種原則性的方法來演化輸入圖的邊緣（即1個單元）特徵，這是一大類 GNN 模型沒有考慮到的問題。

高階交互

圖表根據定義是二元的（「成對的」），不能表示涉及兩個以上物件的關係和交互。在對以高階相互作用為特徵的複雜系統進行建模時，這可能是一個問題：例如，化學反應中的三種反應物可能同時發生相互作用。在細胞複合體中，這種情況可以透過兩個細胞（即「填充」三角形）連接反應物來編碼。因此，模型的計算流程適應高階交互作用的存在。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：細胞Weisfeiler-Lehman（CWL）測試，將經典的WL測試擴展到細胞群，演算法的每一步都完美地散列了相鄰單元的顏色（可能有不同的維度）。

表現力

訊息傳遞GNN 的表達能力受Weisfeiler-Leman (WL) 圖同構測試限制，眾所周知，WL 無法偵測某些圖子結構，例如三角形或循環，即使是非常簡單的非同構圖也無法區分。

根據先前的論文顯示（論文地址：https://arxiv.org/abs/2103.03212；https://arxiv.org/ abs/2106.12575），WL 測試(CWL) 的細胞版本可用來測試細胞複合物的同構性。當這個新測試與上面描述的圖提升過程相符時，可以發現，它能比 WL 測試區分更大的圖類。因此，在一定條件下，拓樸信息傳遞過程繼承了此測試的優點，相較於標準 GNN 提高了表達能力。

不足、過度平滑和瓶頸

訊息傳遞的 GNN 需要n個層來使相距n個跳數的節點進行通訊。當只使用幾層，以至於相距較遠的節點無法交換信息時，這種現象稱為未達到。

相較之下，使用太多層可能會導致過度平滑，且資訊可能會在圖的結構瓶頸中遺失。

單元複合體可以緩解這些問題，因為由高維單元誘導的更豐富的鄰域結構，在可能相距很遠的節點之間創建了捷徑。因此，資訊只需包含一些計算步驟來傳播，就是有效的。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：GNN 需要很多層才能讓相距很遠的節點進行通訊（左）。高維單元透過創造捷徑來改變空間的底層拓樸（右）。這允許遠端節點在幾個資訊傳遞步驟中交換資訊。

分層建模

拓撲信#利息傳遞執行的計算是分層的，訊息從低維單元流向高維單元並返回，可看作是「垂直」（和可區分）池的一種形式，而非標準圖神經網路中的「水平」池。這保持了「壓縮」圖區域的歸納偏差，而不會忽略輸入圖的會損害基於 GNN 池性能的細粒度資訊。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：拓撲訊息傳遞允許資訊存在於不同維度的單元之間分層

域對齊

##某些應用自然與細胞複合物的結構一致，例如，分子的原子、鍵結和化學環可以表示為0-cell、1-cell 和2-cell，分子的物理結構和細胞的複雜表示之間的直接對應，允許了拓樸資訊傳遞利用上述特性，這些表示也展示了拓樸信息傳遞在分子特性預測任務中所實現的最先進結果。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

其他表現良好對齊的應用程序，可能包括電腦圖形應用程式中的離散流形（網格）、社交網路（派系特別重要）或空間圖，例如Google地圖（街道間的街區可自然表示為「立方」細胞）。

圖註：咖啡因子被建模為二維細胞複合物

2 拓樸學和微分幾何學的結合

拓樸訊息傳遞中，保留了許多與代數拓樸學、微分幾何學的有趣聯繫，允許使用迄今為止仍在圖和幾何深度學習中沒有充分開發的數學工具。

洞代數和方向等值

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

在代數拓撲中，通常使用有向單純複形，其中每個單純形存在任意“定向”，例如，我們選擇每條邊中的一個來源節點和一個目標節點，並對每個三角形選擇一個遍歷其節點的順序。一旦選定方向後，就可對複形執行有趣的代數算子，例如透過「邊界算子」計算某些單純形的邊界。這些代數運算也可以用來在單純複形中找到「洞」——沒有邊界但不在其他事物邊界上的區域。背後，持久同源依靠這些計算來偵測拓樸特徵。

圖註：應用於 2-單純形的邊界算子產生一個三角形。再次將算子應用於三角形，結果為零，由於三角形是一個循環，因此它沒有邊界。拓樸訊息傳遞可以看作是代數算符（例如邊界算子）的（非線性）推廣。因此，拓樸信息傳遞表現類似是有必要的：我們希望各層的輸出能夠「一致」地響應輸入複合物方向的變化。換句話說，我們希望我們的層是方向等值的。在工作中，我們研究了拓樸

信

息傳遞是如何透過選擇合適的非線性和

信

息傳遞函數來滿足這一特性，同時，純卷積設定中也對這一點進行了研究。

區分拓樸空間

最早已知的拓樸不變量之一、歐拉特徵，最初用於柏拉圖固體的分類，我們可以將其定義為每個維度中單元格數量的交替總和。令人驚訝的是，如果兩個細胞複合體是同胚的，即便它們是同一空間的不同離散，這些和也將是一致的。

有趣的是，拓樸資訊傳遞模型的讀出操作，使其能很容易計算出該拓撲的不變性，因為它對每個維度單元應用了一個可包容不變量的還原。

#########因此，這類模型在建構上可以區分某些非同構的空間（即具有不同的歐拉特徵）。從計算的角度來看，這可以被看作是 WL 測試的一種推廣，在 WL 測試中，我們不僅對確定兩個細胞複合物是否相同感興趣，也對它們是否彼此同構感興趣。 ######

離散霍奇理論

離散霍奇理論為細胞複合物的拓樸性質提供了一個更幾何的解釋。當與k-細胞相關的特徵符號取決於k-細胞的方向時，這些特徵在數學上可被看作是微分幾何中的微分k-形的離散版本（即可以被整合的k維體積元素）。一個被稱為霍奇拉普拉斯的算子概括了圖形拉普拉斯，它可作用於這些微分形式。可以證明，基於此拉普拉斯算子的擴散 PDE ，會在極限內收斂與複合物的洞的有關訊號。

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

圖註：基於霍奇拉普拉斯算子的擴散偏微分方程，收斂於初始微分形式在拉普拉斯算子核上投影的極限。此影像顯示了霍奇拉普拉斯算子的零特徵向量是如何在複合體中的洞周圍取高值。

第一個簡單的神經網路模型其實是基於何杰拉普拉斯的捲積模型，反之，又受到拓樸訊號處理的啟發。就在最近，基於該算子的一個版卷積模型被用來解決計算代數拓樸學中的NP-hard問題。

3 最後的思考

這些只是變相的圖表嗎？

最近有論文認為，除此之外，拓樸訊息傳遞方法不過是在編碼細胞複合體結構的修正圖上操作訊息傳遞的 GNN 。這對卷積模型來說是正確的，其資訊傳遞計算涉及成對的單元格。

然而，在其最一般的形式中，信息函數允許高維單元格調製其邊界上的低維單元格之間傳遞的資訊.一般情況下，能透過圖上的常規信息傳遞，因為一邊剛好連接兩個節點，而一個2-單元格可以任意連接多的邊。

在這兩種情況下，計算都是由資料所依附的底層空間的拓樸結構所驅動的。我們相信，在訊息傳遞上採用這種拓樸視角所帶來的好處，要超越純粹的計算考量。除了有價值的數學聯繫外，它還為其他數學和計算學科打開了研究話語，有利於我們經常過於單調的社區之間的積極交叉融合。

拓樸訊息傳遞的下一步是什麼？

我們預期拓樸訊息傳遞方法的兩個主要未來方向：

#第一，多年來在GNN中開發的許多架構（如注意力機制）可能會在這些新的拓樸空間中被採用，同時可利用它們的特定特徵。

其次，來自代數拓撲領域的更多數學物件和工具（包括諸如蜂窩滑輪之類的結構，即使是最精通數學的ML 研究人員，對他們來說可能聽起來也很陌生）將被圖和幾何深度學習社群採用。

這些方法既可以為舊問題提供答案，也可以幫助解決新問題，正如Robert Ghrist 所說：「novel challenges necessitate novel math」（新的挑戰需要新的數學）。

以上是Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7773

Java教學

1644

CakePHP 教程

1399

Laravel 教程

1296

PHP教程

1234

Related knowledge

CUDA之通用矩陣乘法：從入門到熟練！ Mar 25, 2024 pm 12:30 PM

通用矩陣乘法（GeneralMatrixMultiplication，GEMM）是許多應用程式和演算法中至關重要的一部分，也是評估電腦硬體效能的重要指標之一。透過深入研究和優化GEMM的實現，可以幫助我們更好地理解高效能運算以及軟硬體系統之間的關係。在電腦科學中，對GEMM進行有效的最佳化可以提高運算速度並節省資源，這對於提高電腦系統的整體效能至關重要。深入了解GEMM的工作原理和最佳化方法，有助於我們更好地利用現代計算硬體的潛力，並為各種複雜計算任務提供更有效率的解決方案。透過對GEMM性能的優

word文檔怎麼計算加減乘除 Mar 19, 2024 pm 08:13 PM

WORD是一個強大的文字處理器，我們可以利用word進行各種文字的編輯，在Excel表格當中，我們已經熟練了加減乘數的運算方法，那麼如果需要在Word表格裡，計算數值的加減乘數，該如何操作呢，難道只能用計算機計算嗎？答案當然是否定的，WORD也同樣可以完成。今天小編就來教大家如何在Word文件的表格當中，運用公式計算加減乘除等基本運算，一起來學習一下吧。那麼，今天就讓小編具體示範一下，WORD文件怎麼計算加減乘除？第一步：開啟一個WORD,點選工具列【插入】下的【表格】，在下拉式選單當中插入一

YOLO不死！ YOLOv9出爐：性能速度SOTA~ Feb 26, 2024 am 11:31 AM

如今的深度學習方法專注於設計最適合的目標函數，以使模型的預測結果與實際情況最接近。同時，必須設計一個合適的架構，以便為預測取得足夠的資訊。現有方法忽略了一個事實，當輸入資料經過逐層特徵提取和空間變換時，大量資訊將會遺失。本文將深入探討資料透過深度網路傳輸時的重要問題，即資訊瓶頸和可逆函數。基於此提出了可編程梯度資訊（PGI）的概念，以應對深度網路實現多目標所需的各種變化。 PGI可以為目標任務提供完整的輸入訊息，以計算目標函數，從而獲得可靠的梯度資訊以更新網路權重。此外設計了一種新的輕量級網路架

如何使用Python的count()函數計算清單中某個元素的數量 Nov 18, 2023 pm 02:53 PM

如何使用Python的count()函數計算清單中某個元素的數量，需要具體程式碼範例Python作為一種強大且易學的程式語言，提供了許多內建函數來處理不同的資料結構。其中之一就是count()函數，它可以用來計算清單中某個元素的數量。在本文中，我們將詳細介紹如何使用count()函數，並提供具體的程式碼範例。 count()函數是Python的內建函數，用來計算某

使用行列式計算三角形面積的Java程序 Aug 31, 2023 am 10:17 AM

簡介使用行列式計算三角形面積的Java程序是一個簡潔且有效率的程序，可以根據給定三個頂點的座標來計算三角形的面積。該程式對於學習或使用幾何的任何人都非常有用，因為它演示瞭如何在Java中使用基本算術和代數計算，以及如何使用Scanner類讀取使用者輸入。程式提示使用者輸入三角形三個點的座標，然後將其讀入並用於計算座標矩陣的行列式。使用行列式的絕對值來確保面積始終為正，然後使用公式計算三角形的面積並顯示給使用者。該程式可以輕鬆修改以接受不同格式的輸入或執行附加計算，使其成為幾何計算的多功能工具。決定因素行列

在Java中遞歸地計算子字串出現的次數 Sep 17, 2023 pm 07:49 PM

給定兩個字串str_1和str_2。目標是使用遞歸過程計算字串str1中子字串str2的出現次數。遞歸函數是在其定義中呼叫自身的函數。如果str1是"Iknowthatyouknowthatiknow"，str2是"know"出現次數為-3讓我們透過範例來理解。例如輸入str1="TPisTPareTPamTP",str2="TP";輸出Countofoccurrencesofasubstringrecursi

1.3ms耗時！清華最新開源行動裝置神經網路架構 RepViT Mar 11, 2024 pm 12:07 PM

论文地址：https://arxiv.org/abs/2307.09283代码地址：https://github.com/THU-MIG/RepViTRepViT在移动端ViT架构中表现出色，展现出显著的优势。接下来，我们将探讨本研究的贡献所在。文中提到，轻量级ViTs通常比轻量级CNNs在视觉任务上表现得更好，这主要归功于它们的多头自注意力模块(MSHA)可以让模型学习全局表示。然而，轻量级ViTs和轻量级CNNs之间的架构差异尚未得到充分研究。在这项研究中，作者们通过整合轻量级ViTs的有效

如何使用C#中的Math.Pow函數計算指定數的冪次方 Nov 18, 2023 am 11:32 AM

在C#中，有一個Math類別庫，其中包含許多數學函數。其中包括計算冪次方的函數Math.Pow，它可以幫助我們計算指定數的冪。 Math.Pow函數的用法非常簡單，只需要指定底數和指數就可以了。其語法如下：Math.Pow(base,exponent);其中base表示底數，exponent表示指數。此函數傳回double類型的結果，即冪次方的計算結果。下面讓

See all articles

Michael Bronstein從代數拓樸學取經，提出了一種新的圖神經網路運算結構！

1 机器学习与数据科学中的拓扑

在GNN 中超越圖

高階特徵和結構

高階交互

表現力

不足、過度平滑和瓶頸

分層建模

域對齊

息傳遞是如何透過選擇合適的非線性和

離散霍奇理論

3 最後的思考

這些只是變相的圖表嗎？

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題