Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！-人工智能-PHP中文网

本文由Cristian Bodnar 和Fabrizio Frasca 合着，以C. Bodnar 、F. Frasca 等人发表于2021 ICML《Weisfeiler and Lehman Go Topological: 信息传递简单网络》和2021 NeurIPS 《Weisfeiler and Lehman Go Cellular: CW 网络》论文为参考。

本文仅是通过微分几何学和代数拓扑学的视角讨论图神经网络系列的部分内容。

从计算机网络到大型强子对撞机中的粒子相互作用，图可以用来模拟任何东西。图之所以无处不在，是因为它们具有离散性和组合性，这使得它们能够表达抽象关系，同时又易于计算。它们受欢迎的原因之一是图抽象出几何图形，即节点在空间中的位置或边缘是如何弯曲的，只留下节点如何连接的表示。

图论起源于莱昂哈德· 欧拉（Leonhard Euler）在1741年的著作《geometria situs》中的观察，他指出著名的柯尼斯堡七桥问题问题没有解决方案。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：七桥问题要求在哥尼斯堡市内找到一条循环行走的路线，不需要多次过桥。正如欧拉所说，哥尼斯堡市的确切形状并不重要，重要的是不同的土地（图的节点）是如何相互连接的（边）。欧拉表明，当且仅当所有节点具有偶数度时，这样的循环才存在。另外，最初的桥梁中只有五座存活到现代。图源：维基百科

有趣的是，欧拉的发现不仅标志着图论的开始，而且也常常被认为是拓扑学诞生的标志。与图一样，拓扑学家对空间的那些与其特定形状或几何形状无关的属性感兴趣。

这些思想的现代表现形式出现在1895年的“分析地点” （Analysis situs），这是Henri Poincaré 的一篇开创性的论文，他的工作点燃了对流形的组合描述的兴趣，从这些流形中可以更容易地找到和计算拓扑不变量。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：Leonhard Euler（1707-1783）和Henri Poincaré（1854-1912）

这些组合描述今天被称为细胞复合体，可以被认为是图的高维概括。

与由节点和边形成的图不同，细胞复合体也可以包含更高维的结构或“细胞”：顶点是0-细胞，边是1-细胞， 2D 表面是2-细胞等。为了构建一个细胞复合体，我们可以通过将一个细胞的边界粘合到其他低维细胞上来进行分层。

在特殊情况下，当单元格由单形（如边、三角形、四面体等）构成时，这些空间也称为单形复合体。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：图可以看作是我们附加边（1-单元格）的一组顶点。类似地，单细胞复合体和细胞复合体可以看作是我们连接2-细胞（蓝色显示）、3-细胞（绿色显示）等的图形。

1 机器学习与数据科学中的拓扑

我们认为，人们不必等待400 年才将把拓扑学变成一种实用的工具。

在拓扑数据分析（TDA）的保护伞下，诸如浅层复合物这样的拓扑结构已经被用于机器学习和数据科学，这类方法出现在20世纪90年代，试图以一种对度量不敏感和对噪声稳健的方式来分析“数据的形状”。

TDA的根源可以追溯到20世纪20年代末最多产的拓扑学家之一 Leopold Vietnam oris 的工作。然而，这些技术必须等到现代计算的诞生才能大规模应用。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：给定一个点云，每个点周围固定半径的封闭球之间的交叉点产生一个简单的复合体。通过逐步增加球的半径，我们可以得到一个嵌套的简单复合体序列。图源：Bastian Rieck。

TDA 的主力是持久性同源性（PH），一种从点云中提取拓扑特征的方法。给定一个点的数据集，PH 创建一个简单复数的嵌套序列，其中每个复数对应于分析基础点云的某个比例。然后，它跟踪各种拓扑特征（例如，连接的组件、循环或空洞），这些特征随着比例的逐渐增加而出现和消失，并且人们从序列中的一个复合物过渡到下一个复合物。

在深度学习时代，持久性同源性有了“第二次生命”，因为它表明人们可以通过它进行反向传播，从而允许将已经建立的 TDA 设备集成到深度学习框架中。

最近的一系列工作提出了在几何深度学习中简化和细胞复合体的不同用途，作为一个更丰富的底层拓扑空间来支持数据和对其进行的计算。

最早利用这一观点的几项工作提出了卷积模型以及在简化复合体上操作的随机行走方法。如在本文中，卷积模型可以被理解为简单和细胞复合体上信息传递的具体实例。

由于计算是由这些空间的拓扑结构（即邻域结构）驱动的，我们把这套方法称为拓扑信息传递。在这个框架中，相邻的单元，可能是不同维度的，正在交换信息，如下图所示。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：拓扑信息传递示意图。蓝色箭头描述了上层相邻细胞之间的“水平”信息传播，即同一高维细胞的边界上的细胞。红色箭头描述了“垂直”信息传播，即细胞从其边界的低维细胞中接收信息。将来自边界细胞的信息汇总到一个更粗的表示中，这种计算可以被解释为一种（可微分的）集合形式。

在 GNN 中超越图

尽管细胞复合体提供了丰富的结构，但我们不能忽视图是迄今为止机器学习中最常见的拓扑对象，而且很少有数据集能超越它们。尽管如此，人们仍然可以通过转换输入图来利用这些有趣的拓扑空间。

我们把将图转换为高维拓扑空间称为“提升”，以类似于范畴理论中的同名概念。它是一种转换，通过遵循某些规则将高维单元附加到输入图上。例如，一个图可以通过在图的每个悬崖或周期上附加一个高维单元而被提升为一个单元复合体。通过这样做，图被替换成一个不同的空间，它有更多的结构，可以为GNN提供一个比原始图更好的计算结构。在下文中，我们将讨论这种方法的具体优势。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：通过将二维封闭圆盘的边界粘合到图中的诱导循环上，可以从图中构造出高维的细胞复合体。

高阶特征和结构

GNN通常采用以节点为中心的观点，驻留在边上的数据仅被视为增加顶点间通信的辅助信息。在拓扑信息传递中，所有单元都是一等公民。无论它们的维度如何，它们都被分配了一个特定的表示，这个表示是通过与相邻的单元交换信息而发展起来的。这为明确地模拟某些高阶结构和它们之间的相互作用提供了一个秘诀。特别是，它提供了一种原则性的方法来演化输入图的边缘（即1个单元）特征，这是一大类 GNN 模型没有考虑到的问题。

高阶交互

图表根据定义是二元的（“成对的”），不能表示涉及两个以上对象的关系和交互。在对以高阶相互作用为特征的复杂系统进行建模时，这可能是一个问题：例如，化学反应中的三种反应物可能同时发生相互作用。在细胞复合体中，这种情况可以通过两个细胞（即“填充”三角形）连接反应物来编码。因此，模型的计算流程适应高阶交互的存在。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：细胞 Weisfeiler-Lehman（CWL）测试，将经典的WL测试扩展到细胞群，算法的每一步都完美地散列了相邻单元的颜色（可能有不同的维度）。

表现力

信息传递 GNN 的表达能力受 Weisfeiler-Leman (WL) 图同构测试限制，众所周知，WL 无法检测某些图子结构，例如三角形或循环，即使是非常简单的非同构图也无法区分。

据此前的论文显示（论文地址：https://arxiv.org/abs/2103.03212；https://arxiv.org/abs/2106.12575），WL 测试 (CWL) 的细胞版本可用于测试细胞复合物的同构性。当这个新测试与上面描述的图提升过程相配时，可以发现，它能比 WL 测试区分更大的图类。因此，在一定条件下，拓扑信息传递过程继承了该测试的优点，相比标准 GNN 提高了表达能力。

不足、过度平滑和瓶颈

信息传递的 GNN 需要n个层来使相距n个跳数的节点进行通信。当仅使用几层，以至于相距较远的节点无法交换信息时，这种现象称为未达到。

相比之下，使用太多层可能会导致过度平滑，且信息可能会在图的结构瓶颈中丢失。

单元复合体可以缓解这些问题，因为由高维单元诱导的更丰富的邻域结构，在可能相距很远的节点之间创建了捷径。因此，信息只需包含一些计算步骤来传播，就是有效的。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：GNN 需要很多层才能使相距很远的节点进行通信（左）。高维单元通过创建捷径来改变空间的底层拓扑结构（右）。这允许远程节点在几个信息传递步骤中交换信息。

分层建模

拓扑信息传递执行的计算是分层的，信息从低维单元流向高维单元并返回，可看作是“垂直”（和可区分）池的一种形式，而非标准图神经网络中的“水平”池。这保持了“压缩”图区域的归纳偏差，而不会忽略输入图的会损害基于 GNN 池性能的细粒度信息。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：拓扑信息传递允许信息存在于不同维度的单元之间分层

域对齐

某些应用自然与细胞复合物的结构一致，例如，分子的原子、键和化学环可以表示为 0-cell、1-cell 和 2-cell，分子的物理结构和细胞的复杂表示之间的直接对应，允许了拓扑信息传递利用上述特性，这些表示也展示了拓扑信息传递在分子特性预测任务中所实现的最先进结果。

其他表现良好对齐的应用程序，可能包括计算机图形应用程序中的离散流形（网格）、社交网络（派系特别重要）或空间图，例如谷歌地图（街道间的街区可被自然地表示为“立方”细胞）。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：咖啡因子被建模为二维细胞复合物

2 拓扑学和微分几何学的结合

拓扑信息传递中，保留了许多与代数拓扑学、微分几何学的有趣联系，允许使用迄今为止仍在图和几何深度学习中没有得到充分开发的数学工具。

洞代数和方向等值

在代数拓扑中，通常使用有向单纯复形，其中每个单纯形存在任意“定向”，例如，我们选择每条边中的一个源节点和一个目标节点，并对每个三角形选一个遍历其节点的顺序。一旦选定方向后，就可对复形执行有趣的代数算子，例如通过“边界算子”计算某些单纯形的边界。这些代数运算也可以用来在单纯复形中找到“洞”——没有边界但不在其他事物边界上的区域。其背后，持久同源依靠这些计算来检测拓扑特征。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：应用于 2-单纯形的边界算子产生一个三角形。再次将算子应用于三角形，结果为零，由于三角形是一个循环，因此它没有边界。

拓扑信息传递可以看作是代数算子（例如边界算子）的（非线性）推广。因此，拓扑信息传递表现类似是有必要的：我们希望各层的输出能够“一致”地响应输入复合物方向的变化。换句话说，我们希望我们的层是方向等值的。在工作中，我们研究了拓扑信息传递是如何通过选择合适的非线性和信息传递函数来满足这一特性，同时，纯卷积设置中也对这一点进行了研究。

区分拓扑空间

最早已知的拓扑不变量之一、欧拉特征，最初用于柏拉图固体的分类，我们可以将其定义为每个维度中单元格数量的交替总和。令人惊讶的是，如果两个细胞复合体是同胚的，即便它们是同一空间的不同离散，这些和也将是一致的。

有趣的是，拓扑信息传递模型的读出操作，使其能很容易计算出该拓扑的不变性，因为它对每个维度单元应用了一个可包容不变量的还原。

因此，这类模型在构造上可以区分某些非同构的空间（即具有不同的欧拉特征）。从计算的角度来看，这可以被看作是 WL 测试的一种推广，在 WL 测试中，我们不仅仅对确定两个细胞复合物是否相同感兴趣，也对它们是否彼此同构感兴趣。

离散霍奇理论

离散霍奇理论为细胞复合物的拓扑性质提供了一个更几何的解释。当与k-细胞相关的特征符号取决于k-细胞的方向时，这些特征在数学上可被看作是微分几何中的微分k-形的离散版本（即可以被整合的k维体积元素）。一个被称为霍奇拉普拉斯的算子概括了图形拉普拉斯，它可作用于这些微分形式。可以证明，基于此拉普拉斯算子的扩散 PDE ，会在极限内收敛与复合物的洞的有关信号。

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

图注：基于霍奇拉普拉斯算子的扩散偏微分方程，收敛于初始微分形式在拉普拉斯算子核上投影的极限。该图像显示了霍奇拉普拉斯算子的零特征向量是如何在复合体中的洞周围取高值。

第一个简单的神经网络模型实际上是基于霍奇拉普拉斯的卷积模型，反之，又受到拓扑信号处理的启发。就在最近，基于该算子的一个版卷积模型被用于解决计算代数拓扑学中的NP-hard问题。

3 最后的思考

这些只是变相的图表吗？

最近有论文认为，除其他外，拓扑信息传递方法不过是在编码细胞复合体结构的修正图上操作信息传递的 GNN 。这对卷积模型来说是正确的，其信息传递计算涉及到成对的单元格。

然而，在其最一般的形式中，信息函数允许高维单元格调制其边界上的低维单元格之间传递的信息。一般情况下，能通过图上的常规信息传递，因为一条边正好连接两个节点，而一个2-单元格可以任意连接多的边。

在这两种情况下，计算都是由数据所依附的底层空间的拓扑结构所驱动的。我们相信，在信息传递上采用这种拓扑视角所带来的好处，要超出纯粹的计算考虑。除了有价值的数学联系外，它还为其他数学和计算学科打开了研究话语，有利于我们经常过于单调的社区之间的积极交叉融合。

拓扑信息传递的下一步是什么？

我们预计拓扑信息传递方法的两个主要未来方向：

第一，多年来在GNN中开发的许多架构（如注意力机制）可能会在这些新的拓扑空间中被采用，同时可利用它们的特定特征。

其次，来自代数拓扑领域的更多数学对象和工具（包括诸如蜂窝滑轮之类的结构，即使是最精通数学的 ML 研究人员，对他们来说可能听起来也很陌生）将被图和几何深度学习社区采用。

这些方法既可以为老问题提供答案，也可以帮助解决新问题，正如Robert Ghrist 所说：「novel challenges necessitate novel math」（新的挑战需要新的数学）。

以上是Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7554

CakePHP 教程

1382

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

CUDA之通用矩阵乘法：从入门到熟练！ Mar 25, 2024 pm 12:30 PM

通用矩阵乘法（GeneralMatrixMultiplication，GEMM）是许多应用程序和算法中至关重要的一部分，也是评估计算机硬件性能的重要指标之一。通过深入研究和优化GEMM的实现，可以帮助我们更好地理解高性能计算以及软硬件系统之间的关系。在计算机科学中，对GEMM进行有效的优化可以提高计算速度并节省资源，这对于提高计算机系统的整体性能至关重要。深入了解GEMM的工作原理和优化方法，有助于我们更好地利用现代计算硬件的潜力，并为各种复杂计算任务提供更高效的解决方案。通过对GEMM性能的优

word文档怎么计算加减乘除 Mar 19, 2024 pm 08:13 PM

WORD是一个强大的文字处理器，我们可以利用word进行各种文字的编辑，在Excel表格当中，我们已经熟练掌握了加减乘数的运算方法，那么如果需要在Word表格里，计算数值的加减乘数，该如何操作呢，难道只能用计算器计算吗？答案当然是否定的，WORD也同样可以完成。今天小编就来教大家如何在Word文档的表格当中，运用公式计算加减乘除等基本运算，一起来学习一下吧。那么，今天就让小编具体演示一下，WORD文档怎么计算加减乘除？第一步：打开一个WORD,单击工具栏【插入】下的【表格】，在下拉菜单当中插入一

YOLO不死！YOLOv9出炉：性能速度SOTA~ Feb 26, 2024 am 11:31 AM

如今的深度学习方法专注于设计最适合的目标函数，以使模型的预测结果与实际情况最接近。同时，必须设计一个合适的架构，以便为预测获取足够的信息。现有方法忽略了一个事实，即当输入数据经过逐层特征提取和空间变换时，大量信息将会丢失。本文将深入探讨数据通过深度网络传输时的重要问题，即信息瓶颈和可逆函数。基于此提出了可编程梯度信息（PGI）的概念，以应对深度网络实现多目标所需的各种变化。PGI可以为目标任务提供完整的输入信息，以计算目标函数，从而获得可靠的梯度信息以更新网络权重。此外设计了一种新的轻量级网络架

如何使用Python的count()函数计算列表中某个元素的数量 Nov 18, 2023 pm 02:53 PM

如何使用Python的count()函数计算列表中某个元素的数量，需要具体代码示例Python作为一种强大且易学的编程语言，提供了许多内置函数来处理不同的数据结构。其中之一就是count()函数，它可以用来计算列表中某个元素的数量。在本文中，我们将详细介绍如何使用count()函数，并提供具体的代码示例。count()函数是Python的内置函数，用于计算某

使用行列式计算三角形面积的Java程序 Aug 31, 2023 am 10:17 AM

简介使用行列式计算三角形面积的Java程序是一个简洁高效的程序，可以根据给定三个顶点的坐标来计算三角形的面积。该程序对于学习或使用几何的任何人都非常有用，因为它演示了如何在Java中使用基本算术和代数计算，以及如何使用Scanner类读取用户输入。程序提示用户输入三角形三个点的坐标，然后将其读入并用于计算坐标矩阵的行列式。使用行列式的绝对值来确保面积始终为正，然后使用公式计算三角形的面积并显示给用户。该程序可以轻松修改以接受不同格式的输入或执行附加计算，使其成为几何计算的多功能工具。决定因素行列

在Java中递归地计算子字符串出现的次数 Sep 17, 2023 pm 07:49 PM

给定两个字符串str_1和str_2。目标是使用递归过程计算字符串str1中子字符串str2的出现次数。递归函数是在其定义中调用自身的函数。如果str1是"Iknowthatyouknowthatiknow"，str2是"know"出现次数为-3让我们通过示例来理解。例如输入str1="TPisTPareTPamTP",str2="TP";输出Countofoccurrencesofasubstringrecursi

如何使用C#中的Math.Pow函数计算指定数的幂次方 Nov 18, 2023 am 11:32 AM

在C#中，有一个Math类库，其中包含许多数学函数。其中包括计算幂次方的函数Math.Pow，它可以帮助我们计算指定数的幂。Math.Pow函数的用法非常简单，只需要指定底数和指数就可以了。其语法如下：Math.Pow(base,exponent);其中base表示底数，exponent表示指数。该函数返回double类型的结果，即幂次方的计算结果。下面让

1.3ms耗时！清华最新开源移动端神经网络架构 RepViT Mar 11, 2024 pm 12:07 PM

论文地址：https://arxiv.org/abs/2307.09283代码地址：https://github.com/THU-MIG/RepViTRepViT在移动端ViT架构中表现出色，展现出显着的优势。接下来，我们将探讨本研究的贡献所在。文中提到，轻量级ViTs通常比轻量级CNNs在视觉任务上表现得更好，这主要归功于它们的多头自注意力模块(MSHA)可以让模型学习全局表示。然而，轻量级ViTs和轻量级CNNs之间的架构差异尚未得到充分研究。在这项研究中，作者们通过整合轻量级ViTs的有效

See all articles

Michael Bronstein从代数拓扑学取经，提出了一种新的图神经网络计算结构！

1 机器学习与数据科学中的拓扑

在 GNN 中超越图​

高阶特征和结构

高阶交互

表现力

不足、过度平滑和瓶颈

分层建模

域对齐

洞代数和方向等值

区分拓扑空间

离散霍奇理论

3 最后的思考

这些只是变相的图表吗？

拓扑信息传递的下一步是什么？

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题

在 GNN 中超越图