谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络-人工智能-PHP中文网

首页

科技周边

人工智能

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 07, 2024 pm 09:50 PM

数据模型社交网络

2005年，划时代之作「The Graph Neural Network Model」的问世，将图神经网络带到每个人面前。

在此之前，科学家处理图数据的方式是，在数据预处理阶段，将图转换为一组「向量表示」。

而CNN的出现彻底改变这种信息丢失的弊端，近20年来，一代又一代模型不断演变，推动ML领域进步。

今天，谷歌正式官宣发布TensorFlow GNN 1.0（TF-GNN）——用于大规模构建GNN的经过生产测试的库。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

它既支持在TensorFlow中的建模和训练，也支持从大型数据存储中提取输入图。

TF-GNN是专为异构图从头开始构建的，其中对象和关系的类型由不同的节点和边集合来表示。

现实世界中的对象及其关系以不同的类型出现，而TF-GNN的异构焦点，使得表示它们变得非常自然。

谷歌科学家Anton Tsitsulin表示，复杂的异构建模又回来了！

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

TF-GNN 1.0首面世

对象及其相互之间的关系，在我们的世界中无处不在。

而关系对于理解一个对象的重要性，不亚于孤立地看待对象本身的属性，比如交通网络、生产网络、知识图谱或社交网络。

离散数学和计算机科学长期以来一直将这类网络形式化为图，由「节点」以各种不规则方式通过边任意连接而成。

然而，大多数机器学习算法只允许输入对象之间存在规则统一的关系，如像素网格、单词序列，或完全没有关系。

图形神经网络，简称GNN，是一种强大的技术，既能利用图的连通性（如早期算法DeepWalk和Node2Vec），又能利用不同节点和边输入特征。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

GNN可以对图的整体（这种分子是否以某种方式做出反应？）、单个节点（根据引用，这份文档的主题是什么？）、潜在的边（这种产品是否可能与另一种产品一起购买？）进行预测。

除了对图形进行预测之外，GNN还是一个强大的工具——用于弥合与更典型的神经网络用例之间的鸿沟。

它们以连续的方式对图的离散关系信息进行编码，从而可以将其自然地纳入另一个深度学习系统。

谷歌在今天正式宣布用于大规模构建GNN的经过生产测试的库——TensorFlow GNN 1.0（TF-GNN）。

在TensorFlow中，这样的图形由 tfgnn.GraphTensor 类型的对象表示。

这是一个复合张量类型（一个Python类中的张量集合），在 tf.data.Dataset 、 tf.function 等中被接受为「头等对象」。

它既能存储图结构，也能存储节点、边和整个图的特征。

GraphTensors的可训练变换可以定义为高级Kera API中的Layers对象，或直接使用 tfgnn.GraphTensor 原语。

GNN：对上下文中的对象进行预测

接下来，进一步解释下TF-GNN，可以看下其中一个典型的应用：

预测一个庞大数据库中，由交叉引用表定义的图中某类节点的属性

举个例子，计算机科学（CS）的引文数据库arxiv论文中，有一对多的引用和多对一的引用关系，可以预测每篇论文的所在的主题领域。

与大多数神经网络一样，GNN也是在许多标记样本（约数百万个）的数据集上进行训练的，但每个训练步骤只包含一批小得多的训练样本（比如数百个）。

为了扩展到数百万个样本，GNN会在底层图中合理小的子图流上进行训练。每个子图包含足够多的原始数据，用于计算中心标记节点的GNN结果并训练模型。

这一过程，通常被称为子图采样，对于GNN训练是极其重要的。

现有的大多数工具都是以批方式完成采样，生成用于训练的静态子图。

而TF-GNN提供了，通过动态和交互采样来改进这一点的工具。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

子图抽样过程，即从一个较大的图中抽取小的、可操作的子图，为GNN训练创建输入示例

TF-GNN 1.0推出了灵活的Python API，用于配置所有相关比例的动态或批处理子图采样：在Colab笔记中交互采样。

具体来说，对存储在单个训练主机主内存中的小型数据集进行「高效采样」，或通过Apache Beam对存储在网络文件系统中的庞大数据集（多达数亿节点和数十亿条边）进行分布式采样。

在这些相同的采样子图上，GNN的任务是，计算根节点的隐藏（或潜在）状态；隐藏状态聚集和编码根节点邻域的相关信息。

一种常见的方法是「消息传递神经网络」。

在每一轮消息传递中，节点沿着传入边接收来自邻节点的消息，并从这些边更新自己的隐藏状态。

在n轮之后，根节点的隐藏状态反映了，n条边内所有节点的聚合信息（如下图所示，n=2)。消息和新的隐藏状态由神经网络的隐层计算。

在异构图中，对不同类型的节点和边使用单独训练的隐藏层通常是有意义的。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

图为一个简单的「消息传递神经网」，在该网络中，每一步节点状态都会从外部节点传播到内部节点，并在内部节点汇集计算出新的节点状态。一旦到达根节点，就可以进行最终预测

训练设置是，通过将输出层放置在已标记节点的GNN的隐藏状态之上、计算损失（以测量预测误差）并通过反向传播更新模型权重来完成的，这在任何神经网络训练中都是常见的。

除了监督训练之外，GNN也可以以无监督的方式训练，可以让我们计算节点及其特征的离散图结构的连续表示（或嵌入）。

然后，这些表示通常在其他ML系统中使用。

通过这种方式，由图编码的离散关系信息，就能被纳入更典型的神经网络用例中。TF-GNN支持对异构图的无监督目标进行细粒度规范。

构建GNN架构

TF-GNN库支持构建和训练，不同抽象层次的GNN。

在最高层，用户可以使用与库绑定在一起的任何预定义模型，这些模型以Kera层表示。

除了研究文献中的一小部分模型外，TF-GNN还附带了一个高度可配置的模型模板，该模板提供了经过精心挑选的建模选择。

谷歌发现这些选择，为我们的许多内部问题提供了强有力的基线。模板实现GNN层；用户只需从Kera层开始初始化。

import tensorflow_gnn as tfgnnfrom tensorflow_gnn.models import mt_albisdef model_fn(graph_tensor_spec: tfgnn.GraphTensorSpec):"""Builds a GNN as a Keras model."""graph = inputs = tf.keras.Input(type_spec=graph_tensor_spec)# Encode input features (callback omitted for brevity).graph = tfgnn.keras.layers.MapFeatures(node_sets_fn=set_initial_node_states)(graph)# For each round of message passing...for _ in range(2):# ... create and apply a Keras layer.graph = mt_albis.MtAlbisGraphUpdate(units=128, message_dim=64,attention_type="none", simple_conv_reduce_type="mean",normalization_type="layer", next_state_type="residual",state_dropout_rate=0.2, l2_regularizatinotallow=1e-5,)(graph)return tf.keras.Model(inputs, graph)

登录后复制

在最低层，用户可以根据用于在图中传递数据的原语，从头开始编写GNN模型，比如将数据从节点广播到其所有传出边，或将数据从其所有传入边汇集到节点中。

当涉及到特征或隐藏状态时，TF-GNN 的图数据模型对节点、边和整个输入图一视同仁。

因此，它不仅可以直接表示像MPNN那样以节点为中心的模型，而且还可以表示更一般形式的的图网络。

这可以（但不一定）使用Kera作为核心TensorFlow顶部的建模框架来完成。

训练编排

虽然高级用户可以自由地进行定制模型训练，但TF-GNN Runner还提供了一种简洁的方法，在常见情况下协调Kera模型的训练。

一个简单的调用可能如下所示：

from tensorflow_gnn import runnerrunner.run( task=runner.RootNodeBinaryClassification("papers", ...), model_fn=model_fn, trainer=runner.KerasTrainer(tf.distribute.MirroredStrategy(), model_dir="/tmp/model"), optimizer_fn=tf.keras.optimizers.Adam, epochs=10, global_batch_size=128, train_ds_provider=runner.TFRecordDatasetProvider("/tmp/train*"), valid_ds_provider=runner.TFRecordDatasetProvider("/tmp/validation*"), gtspec=...,)

登录后复制

Runner为ML Pain提供了现成的解决方案，如分布式训练和云TPU上固定形状的 tfgnn.GraphTensor 填充。

除了单一任务的训练（如上所示）外，它还支持多个（两个或更多）任务的联合训练。

例如，非监督任务可以与监督任务混合，以形成具有特定于应用的归纳偏差的最终连续表示（或嵌入）。调用方只需将任务参数替换为任务映射：

from tensorflow_gnn import runnerfrom tensorflow_gnn.models import contrastive_lossesrunner.run( task={"classification": runner.RootNodeBinaryClassification("papers", ...),"dgi": contrastive_losses.DeepGraphInfomaxTask("papers"),},...)

登录后复制

此外，TF-GNN Runner还包括用于模型归因的集成梯度实现。

集成梯度输出是一个GraphTensor，其连接性与观察到的GraphTensor相同，但其特征用梯度值代替，在GNN预测中，较大的梯度值比较小的梯度值贡献更多。

总之，谷歌希望TF-GNN将有助于推动GNN在TensorFlow中的大规模应用，并推动该领域的进一步创新。

以上是谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7464

CakePHP 教程

1376

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效的特点。它由236B个参数组成，其中21B个参数用于激活每个标记。与DeepSeek67B相比，DeepSeek-V2性能更强，同时节省了42.5%的训练成本，减少了93.3%的KV缓存，最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

替代MLP的KAN，被开源项目扩展到卷积了 Jun 01, 2024 pm 10:03 PM

本月初，来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参数量运行的MLP。比如，作者表示，他们用KAN以更小的网络和更高的自动化程度重现了DeepMind的结果。具体来说，DeepMind的MLP有大约300,000个参数，而KAN只有约200个参数。KAN与MLP一样具有强大的数学基础，MLP基于通用逼近定理，而KAN基于Kolmogorov-Arnold表示定理。如下图所示，KAN在边上具

美国空军高调展示首个AI战斗机！部长亲自试驾全程未干预，10万行代码试飞21次 May 07, 2024 pm 05:00 PM

最近，军事圈被这个消息刷屏了：美军的战斗机，已经能由AI完成全自动空战了。是的，就在最近，美军的AI战斗机首次公开，揭开了神秘面纱。这架战斗机的全名是可变稳定性飞行模拟器测试飞机（VISTA），由美空军部长亲自搭乘，模拟了一对一的空战。5月2日，美国空军部长FrankKendall在Edwards空军基地驾驶X-62AVISTA升空注意，在一小时的飞行中，所有飞行动作都由AI自主完成！Kendall表示——在过去的几十年中，我们一直在思考自主空对空作战的无限潜力，但它始终显得遥不可及。然而如今，

特斯拉机器人进厂打工，马斯克：手的自由度今年将达到22个！ May 06, 2024 pm 04:13 PM

特斯拉机器人Optimus最新视频出炉，已经可以在厂子里打工了。正常速度下，它分拣电池（特斯拉的4680电池）是这样的：官方还放出了20倍速下的样子——在小小的“工位”上，拣啊拣啊拣：这次放出的视频亮点之一在于Optimus在厂子里完成这项工作，是完全自主的，全程没有人为的干预。并且在Optimus的视角之下，它还可以把放歪了的电池重新捡起来放置，主打一个自动纠错：对于Optimus的手，英伟达科学家JimFan给出了高度的评价：Optimus的手是全球五指机器人里最灵巧的之一。它的手不仅有触觉

无需OpenAI数据，跻身代码大模型榜单！UIUC发布StarCoder-15B-Instruct Jun 13, 2024 pm 01:59 PM

在软件技术的前沿，UIUC张令明组携手BigCode组织的研究者，近日公布了StarCoder2-15B-Instruct代码大模型。这一创新成果在代码生成任务取得了显着突破，成功超越CodeLlama-70B-Instruct，登上代码生成性能榜单之巅。 StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略，整个训练流程公开透明，且完全自主可控。该模型通过StarCoder2-15B生成了数千个指令，响应对StarCoder-15B基座模型进行微调，无需依赖昂贵的人工标注数

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型 Jun 01, 2024 pm 04:41 PM

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐LLM方面，一种有效的方法是根据人类反馈的强化学习（RLHF）。尽管RLHF方法的结果很出色，但其中涉及到了一些优化难题。其中涉及到训练一个奖励模型，然后优化一个策略模型来最大化该奖励。近段时间已有一些研究者探索了更简单的离线算法，其中之一便是直接偏好优化（DPO）。DPO是通过参数化RLHF中的奖励函数来直接根据偏好数据学习策略模型，这样就无需显示式的奖励模型了。该方法简单稳定

Yolov10：详解、部署、应用一站式齐全！ Jun 07, 2024 pm 12:05 PM

一、前言在过去的几年里，YOLOs由于其在计算成本和检测性能之间的有效平衡，已成为实时目标检测领域的主导范式。研究人员探索了YOLO的架构设计、优化目标、数据扩充策略等，取得了显着进展。同时，依赖非极大值抑制（NMS）进行后处理阻碍了YOLO的端到端部署，并对推理延迟产生不利影响。在YOLOs中，各种组件的设计缺乏全面彻底的检查，导致显着的计算冗余，限制了模型的能力。它提供了次优的效率，以及相对大的性能改进潜力。在这项工作中，目标是从后处理和模型架构两个方面进一步提高YOLO的性能效率边界。为此

2024年5月值得关注的六个空投项目盘点 May 05, 2024 am 09:04 AM

2024.5还有哪些空投项目值得大家关注呢？六个值得关注的空投项目盘点！五月份有几个空投追逐者正在转向其他目标——没有原生代币的DeFi协议。当用户为空投做好准备时，这种期望往往会导致流动性涌入平台。尽管当前市场放缓阻碍了今年早些时候加密代币的价格上涨，但以下是一些吸引希望的项目。今天本站小编给大家详细介绍六款值得大家关注的空投项目，预祝大家早赚钱！空投希望者继续开发无代币项目。加密货币正在推动投资者存款。空投接受者并没有被项目团队试图否认代币分配的可能性所动摇。四月是空投的重要月

See all articles

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

TF-GNN 1.0首面世

GNN：对上下文中的对象进行预测

构建GNN架构

训练编排

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题