TF-GNN 1.0 が初リリース

GNN: コンテキスト内のオブジェクトの予測

ホームページ

テクノロジー周辺機器

Google が TensorFlow-GNN 1.0 のリリースを正式に発表しました。大規模なグラフニューラルネットワークを構築するための動的かつインタラクティブなサンプリング

Google が TensorFlow-GNN 1.0 のリリースを正式に発表しました。大規模なグラフニューラルネットワークを構築するための動的かつインタラクティブなサンプリング

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 07, 2024 pm 09:50 PM

データモデルソーシャルネットワーク

2005 年、画期的な著作「グラフニューラルネットワークモデル」のリリースにより、グラフニューラルネットワークがすべての人に知られるようになりました。

これ以前は、科学者がグラフデータを処理する方法は、データの前処理段階でグラフを一連の「ベクトル表現」に変換することでした。

CNN の出現により、情報損失というこの欠点は完全に変わりました。過去 20 年間、モデルの世代が進化し続け、ML 分野の進歩を促進しました。

本日、Google は TensorFlow GNN 1.0 (TF-GNN) のリリースを正式に発表しました。これは、大規模な GNN を構築するための実稼働テスト済みライブラリです。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

TensorFlow でのモデリングとトレーニングの両方をサポートするだけでなく、大規模なデータストアからの入力グラフの抽出もサポートします。

TF-GNN は、オブジェクトと関係のタイプがノードとエッジの異なるセットで表される異種グラフ向けにゼロから構築されています。

実世界のオブジェクトとその関係はさまざまなタイプで表示されますが、TF-GNN の異種混合の焦点により、それらの表現が非常に自然になります。

Google の科学者 Anton Tsitsulin 氏は、複雑な異種モデリングが戻ってきたと述べました。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

TF-GNN 1.0 が初リリース

#世界中のどこにでも存在するオブジェクトとその関係。

関係性は、オブジェクトを理解する上で、輸送ネットワーク、生産ネットワーク、ナレッジグラフ、ソーシャルネットワークなど、オブジェクト自体のプロパティを個別に見るのと同じくらい重要です。

離散数学とコンピューターサイエンスは、長い間、さまざまな不規則な方法でエッジによって任意に接続された「ノード」で構成される、このようなネットワークをグラフとして形式化してきました。

ただし、ほとんどの機械学習アルゴリズムでは、ピクセルのグリッド、単語のシーケンスなど、入力オブジェクト間の規則的かつ均一な関係のみが許可されるか、まったく関係が許可されません。

グラフィックニューラルネットワーク (略して GNN) は、グラフの接続性 (初期のアルゴリズム DeepWalk や Node2Vec など) とさまざまなノードおよびエッジ入力機能の両方を活用できる強力なテクノロジです。。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

GNN は、グラフ全体 (この分子は何らかの方法で反応しますか?)、または個々のノード (引用文によると、この文書のトピックは何ですか?)、予測のための潜在的なエッジ (この製品は別の製品と一緒に購入される可能性がありますか?)。

GNN は、グラフで予測を行うだけでなく、より一般的なニューラルネットワークの使用例とのギャップを埋めるための強力なツールです。

グラフの離散関係情報を連続的にエンコードし、別の深層学習システムに自然に組み込むことができます。

Google は本日、大規模な GNN を構築するための実稼働テスト済みライブラリである TensorFlow GNN 1.0 (TF-GNN) を正式に発表しました。

TensorFlow では、このようなグラフは tfgnn.GraphTensor 型のオブジェクトによって表されます。

これは、tf.data.Dataset、tf.function などの「ファーストクラスオブジェクト」として受け入れられる複合テンソル型 (Python クラスのテンソルのコレクション) です。

グラフ構造だけでなく、ノード、エッジ、グラフ全体の特性も保存できます。

GraphTensor のトレーニング可能な変換は、高レベルの Kera API で Layers オブジェクトとして定義するか、tfgnn.GraphTensor プリミティブを直接使用して定義できます。

GNN: コンテキスト内のオブジェクトの予測

次に、TF-GNN についてさらに説明します。典型的なアプリケーションの 1 つを見てみましょう。

## 巨大なデータベース内の相互参照テーブルによって定義されたグラフ内の特定のタイプのノードの属性を予測します

たとえば、コンピューターサイエンス (CS) 引用データベース arxiv 論文には、1 対多の引用と多対 1 の引用関係があり、これにより対象分野を予測できます。各紙。

ほとんどのニューラルネットワークと同様、GNN は多くのラベル付きサンプル (約数百万) のデータセットでトレーニングされますが、各トレーニングステップは小さな多数のトレーニングサンプル (たとえば、何百）。

数百万のサンプルにスケールするために、GNN は基礎となるグラフ内の適度に小さいサブグラフのストリームでトレーニングされます。各サブグラフには、中央のラベル付きノードの GNN 結果を計算し、モデルをトレーニングするのに十分な生データが含まれています。

このプロセスはサブグラフサンプリングと呼ばれることがあり、GNN トレーニングにとって非常に重要です。

既存のツールのほとんどは、バッチモードでサンプリングを完了し、トレーニング用の静的なサブグラフを生成します。

TF-GNN は、動的かつ対話型のサンプリングを通じてこれを改善するツールを提供します。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

サブグラフサンプリングプロセス、つまり、大きなグラフから実用的な小さなサブグラフを抽出して、GNN トレーニング用の入力例を作成します。

TF-GNN 1.0 では、関連するすべてのスケールで動的またはバッチのサブグラフサンプリングを構成するための柔軟な Python API が導入されています。Colab ノートのインタラクティブサンプリングです。

具体的には、単一のトレーニングホストのメインメモリに保存されている小さなデータセット、または Apache Beam 経由でネットワークファイルシステムに保存されている大規模なデータセット (最大数百) の「効率的なサンプリング」です。分散サンプリングの場合、数百万のノードと数十億のエッジ）。

これらの同じサンプリングされたサブグラフ上で、GNN のタスクは、ルートノードの隠れた (または潜在的な) 状態を計算することです。隠れた状態は、ルートノードの近傍の関連情報を集約してエンコードします。。

#一般的な方法は「メッセージパッシングニューラルネットワーク」です。

メッセージングの各ラウンドで、ノードは入力エッジに沿って隣接ノードからメッセージを受信し、これらのエッジから自身の非表示状態を更新します。

n ラウンド後、ルートノードの非表示状態は、n エッジ内のすべてのノードの集約情報を反映します (下の図に示すように、n=2)。メッセージと新しい隠れ状態は、ニューラルネットワークの隠れ層によって計算されます。

異種グラフでは、多くの場合、さまざまな種類のノードとエッジに対して個別にトレーニングされた隠れ層を使用することが合理的です。

谷歌官宣TensorFlow-GNN 1.0发布！动态和交互采样，大规模构建图神经网络

#図は単純な「メッセージパッシングニューラルネットワーク」を示しています。このネットワークでは、ノードのステータスが外部ノードから内部ノードに伝播されます。各ステップでノードが生成され、内部ノード収集を通じて新しいノードのステータスが計算されます。ルートノードに到達すると、最終的な予測を行うことができます。

トレーニングセットアップは、ラベル付きノードの GNN の隠れ状態の上に出力層を配置し、 (予測誤差を測定するため) 損失を計算し、バックプロパゲーションを通じてモデルの重みを更新します。これは、ニューラルネットワークのトレーニングでは一般的です。

教師ありトレーニングに加えて、GNN は教師なしでトレーニングすることもできるため、ノードとその特徴の離散グラフ構造の連続表現 (または埋め込み) を計算できます。

これらの表現は、他の ML システムで一般的に使用されます。

このようにして、グラフによってエンコードされた離散リレーショナル情報を、より一般的なニューラルネットワークの使用例に組み込むことができます。 TF-GNN は、異種グラフ上の教師なしターゲットの詳細な指定をサポートします。

GNN アーキテクチャの構築

TF-GNN ライブラリは、さまざまな抽象化レベルでの GNN の構築とトレーニングをサポートします。

最高レベルでは、ユーザーはライブラリにバンドルされている事前定義モデル (Kera レイヤーとして表される) を使用できます。

研究文献からの少数のモデルセットに加えて、TF-GNN には、慎重に精選されたモデリングの選択肢を提供する、高度に構成可能なモデルテンプレートが付属しています。

Google は、これらの選択肢が社内の問題の多くに対する強力なベースラインを提供することを発見しました。テンプレートは GNN 層を実装しており、ユーザーは Kera 層から初期化するだけで済みます。

うわー

在最低层，用户可以根据用于在图中传递数据的原语，从头开始编写GNN模型，比如将数据从节点广播到其所有传出边，或将数据从其所有传入边汇集到节点中。

当涉及到特征或隐藏状态时，TF-GNN 的图数据模型对节点、边和整个输入图一视同仁。

因此，它不仅可以直接表示像MPNN那样以节点为中心的模型，而且还可以表示更一般形式的的图网络。

这可以（但不一定）使用Kera作为核心TensorFlow顶部的建模框架来完成。

训练编排

虽然高级用户可以自由地进行定制模型训练，但TF-GNN Runner还提供了一种简洁的方法，在常见情况下协调Kera模型的训练。

一个简单的调用可能如下所示：

from tensorflow_gnn import runnerrunner.run( task=runner.RootNodeBinaryClassification("papers", ...), model_fn=model_fn, trainer=runner.KerasTrainer(tf.distribute.MirroredStrategy(), model_dir="/tmp/model"), optimizer_fn=tf.keras.optimizers.Adam, epochs=10, global_batch_size=128, train_ds_provider=runner.TFRecordDatasetProvider("/tmp/train*"), valid_ds_provider=runner.TFRecordDatasetProvider("/tmp/validation*"), gtspec=...,)

ログイン後にコピー

Runner为ML Pain提供了现成的解决方案，如分布式训练和云TPU上固定形状的 tfgnn.GraphTensor 填充。

除了单一任务的训练（如上所示）外，它还支持多个（两个或更多）任务的联合训练。

例如，非监督任务可以与监督任务混合，以形成具有特定于应用的归纳偏差的最终连续表示（或嵌入）。调用方只需将任务参数替换为任务映射：

from tensorflow_gnn import runnerfrom tensorflow_gnn.models import contrastive_lossesrunner.run( task={"classification": runner.RootNodeBinaryClassification("papers", ...),"dgi": contrastive_losses.DeepGraphInfomaxTask("papers"),},...)

ログイン後にコピー

此外，TF-GNN Runner还包括用于模型归因的集成梯度实现。

集成梯度输出是一个GraphTensor，其连接性与观察到的GraphTensor相同，但其特征用梯度值代替，在GNN预测中，较大的梯度值比较小的梯度值贡献更多。

总之，谷歌希望TF-GNN将有助于推动GNN在TensorFlow中的大规模应用，并推动该领域的进一步创新。

以上がGoogle が TensorFlow-GNN 1.0 のリリースを正式に発表しました。大規模なグラフニューラルネットワークを構築するための動的かつインタラクティブなサンプリングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1658

CakePHP チュートリアル

1415

Laravel チュートリアル

1309

PHP チュートリアル

1257

C# チュートリアル

1231

Related knowledge

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニングコストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

MLP に代わる KAN は、オープンソースプロジェクトによって畳み込みまで拡張されました Jun 01, 2024 pm 10:03 PM

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は

総合的にDPOを超える：Chen Danqi氏のチームはシンプルなプリファレンス最適化SimPOを提案し、最強の8Bオープンソースモデルも洗練させた Jun 01, 2024 pm 04:41 PM

大規模言語モデル (LLM) を人間の価値観や意図に合わせるには、人間のフィードバックを学習して、それが有用で、正直で、無害であることを確認することが重要です。 LLM を調整するという点では、ヒューマンフィードバックに基づく強化学習 (RLHF) が効果的な方法です。 RLHF 法の結果は優れていますが、最適化にはいくつかの課題があります。これには、報酬モデルをトレーニングし、その報酬を最大化するためにポリシーモデルを最適化することが含まれます。最近、一部の研究者はより単純なオフラインアルゴリズムを研究しており、その 1 つが直接優先最適化 (DPO) です。 DPO は、RLHF の報酬関数をパラメータ化することで、選好データに基づいてポリシーモデルを直接学習するため、明示的な報酬モデルの必要性がなくなります。この方法は簡単で安定しています

アメリカ空軍が初のAI戦闘機を公開し注目を集める！大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機（VISTA）で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランクケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

OpenAI データは必要ありません。大規模なコードモデルのリストに加わりましょう。 UIUC が StarCoder-15B-Instruct をリリース Jun 13, 2024 pm 01:59 PM

ソフトウェアテクノロジの最前線に立つ UIUC Zhang Lingming のグループは、BigCode 組織の研究者とともに、最近 StarCoder2-15B-Instruct 大規模コードモデルを発表しました。この革新的な成果により、コード生成タスクにおいて大きな進歩が達成され、CodeLlama-70B-Instruct を上回り、コード生成パフォーマンスリストのトップに到達しました。 StarCoder2-15B-Instruct のユニークな特徴は、その純粋な自己調整戦略であり、トレーニングプロセス全体がオープンで透過的で、完全に自律的で制御可能です。このモデルは、高価な手動アノテーションに頼ることなく、StarCoder-15B 基本モデルの微調整に応じて、StarCoder2-15B を介して数千の命令を生成します。

LLMはすべて完了しました！ OmniDrive: 3D 認識と推論プランニングの統合 (NVIDIA の最新) May 09, 2024 pm 04:55 PM

上記と著者の個人的な理解: この論文は、自動運転アプリケーションにおける現在のマルチモーダル大規模言語モデル (MLLM) の主要な課題、つまり MLLM を 2D 理解から 3D 空間に拡張する問題の解決に特化しています。自動運転車 (AV) は 3D 環境について正確な決定を下す必要があるため、この拡張は特に重要です。 3D 空間の理解は、情報に基づいて意思決定を行い、将来の状態を予測し、環境と安全に対話する車両の能力に直接影響を与えるため、AV にとって重要です。現在のマルチモーダル大規模言語モデル (LLaVA-1.5 など) は、ビジュアルエンコーダーの解像度制限や LLM シーケンス長の制限により、低解像度の画像入力しか処理できないことがよくあります。ただし、自動運転アプリケーションには次の要件が必要です。

AI スタートアップ企業は一斉に OpenAI に転職し、イリヤが去った後にセキュリティチームが再編成されました。 Jun 08, 2024 pm 01:00 PM

先週、社内の辞任と社外からの批判が相次ぐ中、OpenAIは内外のトラブルに見舞われた。 - 未亡人姉妹への侵害が世界中で白熱した議論を巻き起こした - 「覇権条項」に署名した従業員が次々と暴露 - ネットユーザーがウルトラマンの「」をリストアップ噂の払拭: Vox が入手した漏洩情報と文書によると、アルトマンを含む OpenAI の上級幹部はこれらの株式回収条項をよく認識しており、承認しました。さらに、OpenAI には、AI セキュリティという深刻かつ緊急の課題が直面しています。最近、最も著名な従業員2名を含むセキュリティ関連従業員5名が退職し、「Super Alignment」チームが解散したことで、OpenAIのセキュリティ問題が再び注目を集めている。フォーチュン誌は OpenA を報じた。

Yolov10: 詳細な説明、展開、アプリケーションがすべて 1 か所にまとめられています。 Jun 07, 2024 pm 12:05 PM

1. はじめにここ数年、YOLO は、計算コストと検出パフォーマンスの効果的なバランスにより、リアルタイム物体検出の分野で主流のパラダイムとなっています。研究者たちは、YOLO のアーキテクチャ設計、最適化目標、データ拡張戦略などを調査し、大きな進歩を遂げました。同時に、後処理に非最大抑制 (NMS) に依存すると、YOLO のエンドツーエンドの展開が妨げられ、推論レイテンシに悪影響を及ぼします。 YOLO では、さまざまなコンポーネントの設計に包括的かつ徹底的な検査が欠けており、その結果、大幅な計算冗長性が生じ、モデルの機能が制限されます。効率は最適ではありませんが、パフォーマンス向上の可能性は比較的大きくなります。この作業の目標は、後処理とモデルアーキテクチャの両方から YOLO のパフォーマンス効率の境界をさらに改善することです。この目的を達成するために

See all articles