グラフコンピューティングについて学び、考える
優れたソフトウェアは、プログラム分析やエラー検出によって発見されるのではなく、適切な人材によって構築されます。
グラフはコンピューティング オブジェクトとしてますます重要になってきており、グラフ構造はグループ関係を抽象化したものであり、豊富なオブジェクトと関係を記述することができます。グラフ コンピューティングの核心は、データをグラフ構造にモデル化する方法と、問題の解をグラフ構造上の計算問題に変換する方法です。問題に相関分析が含まれる場合、グラフ コンピューティングは多くの場合、自然に問題の解を導き出すことができます。グラフ構造に対する一連の操作と計算として表現されます。例えば、Web ページのリンクのグラフ構造に基づく PageRank アルゴリズムは、検索エンジンのランキングの参考となる Web ページの重みを取得するために使用され、グラフ構造のユーザー行動データは、正確な重みを取得するために使用されます。グループの好みの分析とパーソナライズされた製品の推奨結果。
1. グラフ コンピューティングとは何ですか?
グラフ コンピューティングは、人間世界の物事と物事間の関係を研究し、それらを記述、描写、分析、計算する技術です。ここでのグラフは「グラフ」であり、数学のグラフ理論に由来するグラフ「画像」ではありません。
グラフは最も柔軟な接続方法であり、エンティティを制限なく接続できます。グラフ コンピューティングは単なるテクノロジーではなく、世界を理解する方法です。グラフ データは、接続の方向や属性の記述など、物事間の接続を適切に記述することができます。データ構造の観点から見ると、グラフは物事間の関係をネイティブに表現したものです。ある程度、リレーショナル データベースはテーブル データベースと呼ばれる必要があり、グラフ データベースはリレーショナル データベースと呼ばれる必要があります。広義のグラフコンピューティングとは、グラフデータベースを含むグラフデータに基づく様々な処理を指します。
グラフ コンピューティング テクノロジは、従来のコンピューティング モードにおける関連クエリの低効率と高コストの問題を解決します。問題領域内の関係を完全に描写し、豊富で効率的かつ機敏なデータ分析機能を備えています。その特徴は次のとおりです。
- グラフ抽象化に基づくデータ モデル
- グラフ データ モデルの並列抽象化
- グラフ モデル システムの最適化
グラフの場合コンピューティング、パフォーマンス コスト、フォールト トレランス メカニズム、およびスケーラビリティはすべて非常に重要です。
2. 歴史的発展の観点からグラフ コンピューティングを考察する
グラフ コンピューティングは 1960 年代のツリー構造データベースにまで遡ることができ、属性グラフ指向のモデルとテクノロジは 1960 年代に登場しました。 1970年代~1980年代 LDM(論理データモデル)など2007 年までに、最初の商用グラフ データベース Neo4j が確立され、グラフ コンピューティングが発展段階に入ったことを示しました。
グラフ コンピューティング研究の本当の始まりは、Google がビッグ データの並列処理のためのコンピューティング モデルである MapReduce を開発した 2004 年でした。このモデルの発表は、ビッグ データの並列処理に大きな革命的な影響をもたらしました。その後、2006 年に、Apache Hadoop チームは Hadoop 分散ファイル システム (HDFS) と新しい Hadoop MapReduce フレームワークを導入しました。 2009 年、カリフォルニア大学バークレー校の AMP 研究室は Spark システムを開発しました。
2010 年以降、大規模分散アーキテクチャ、マルチモーダル サポート、グラフ クエリ言語設計などのグラフ コンピューティングの研究方向が徐々に注目を集めています。 Google は、BSP コンピューティング モデルに従って、グラフ アルゴリズムの特性に合わせて設計された分散グラフ コンピューティング システムである Pregel を提案し、その後 CMU Select Laboratory GraphLab プロジェクト チームが GAS コンピューティング モデルを提案しました。 。 pregel と GraphLab はどちらも複雑な機械学習計算用の処理フレームワークであり、反復計算に使用されますが、その実装方法は異なります。Pregel はラージブロック メッセージ パッシング メカニズムに基づいており、GraphLab はメモリ共有メカニズムに基づいています。その後の他のグラフ コンピューティング システムの設計に大きな影響を与えます。
Google は 2012 年 5 月に、情報を接続する新しい方法であるナレッジ グラフの概念を提案しました。その基本単位は「エンティティ - 関係 - エンティティ」の 3 つ組であり、エンティティは関係を通じて接続され、相互に接続されて形成されます。ネットワーク化された知識構造。ナレッジグラフの確立の中核はコンピュータの知識推論メカニズムであり、グラフコンピューティングはそれに対する重要な基礎的な技術サポートを提供します。
2015 年、データ量の急速な増加に伴い、アプリケーション市場が徐々に開放され、グラフ コンピューティング システムの拡張性と効率性に対する需要が高まり続けました。中国におけるグラフ コンピューティング分野の学術および産業研究は、清華大学の Gemini など、独自のグラフ コンピューティング システムとプラットフォームを徐々に開発し始めています。
近年、人工知能技術の発展に伴い、グラフニューラルネットワークも業界でその才能を発揮しています。
3. フレームワーク モデルからグラフ コンピューティングを考察する
グラフ コンピューティング フレームワークは、基本的に BSP (Bulk Synchronous Parallell) コンピューティング モデルに従います。 BSP モードのバルク同期メカニズムのユニークな機能は、スーパーステップ概念の導入にあります。計算プロセスは一連のグローバル スーパーステップで構成され、各スーパーステップには並列計算 (ローカル計算)、グローバル通信 (非ローカル データ通信)、フェンス同期 (通信動作の終了待ち) の 3 つのステージが含まれます。
BSP モードには次の特徴があります:
計算を 1 つずつスーパーステップに分割し、デッドロックを効果的に回避します;
プロセッサとルーターを分離し、コンピューティング タスクの分離を強調します。ルータはポイントツーポイントのメッセージ配信のみを完了し、アセンブリ、複製、ブロードキャストなどの機能は提供しませんが、特定の相互接続ネットワーク トポロジを隠すだけでなく、通信プロトコルを簡素化します。
同期モードを採用して、ハードウェアにグローバル同期と制御可能な粗粒レベルを実装し、密結合された同期並列アルゴリズムを実行します。
いくつかの代表的なグラフ コンピューティング フレームワークは次のとおりです。
- Neo4j-APOC: グラフ データベースに基づいて、いくつかの基本的なグラフ アルゴリズムをサポートします。配布バージョンはオープンソースではありません。
- Pregel: Google が 2009 年に提案したグラフ コンピューティング モデルの創始者であり、その後の多くの作品がそのアイデアの影響を受けてきました。オープンソースではありません。
- Giraph: Pregel のアイデアに基づいた Facebook のオープンソース実装。
- ジェミニ: 清華大学は、Pregel のアイデアに基づいて多くの改善を実施し、優れたパフォーマンスを実現しました。無料のデモのみが提供されており、商用バージョンはオープンソースではありません。
- KnightKing: ウォーカー歩行アルゴリズム用に特別に設計されたグラフ コンピューティング フレームワークですが、汎用ではありません。
- GraphX: Spark に基づいて Apache Foundation によって実装されたグラフ コンピューティング フレームワークで、コミュニティ活動が活発です。
- GraphLab (PowerGraph): オープンソースではなく商用ソフトウェアです。 Appleに買収されました。
- Plato: Gemini と KnightKing のアイデアに基づいた Tencent の C オープン ソース実装で、高性能、スケーラブル、接続が簡単なグラフ コンピューティング フレームワークです。
4. アルゴリズムの観点からグラフ計算を見てみる
グラフ アルゴリズムとは、無向グラフや有向グラフなど、特定の頂点と辺を使用して答えを見つける単純な方法を指します。およびネットワーク 一般的に使用される多くのグラフ アルゴリズムを使用できます。グラフ データの場合、トラバーサル アルゴリズム (深さ/幅を優先) が他のアルゴリズムの基礎となります。一般的なグラフ アルゴリズムには、PageRank、最短パス、接続されたブランチ、最大独立セット、最小スパニング ツリー、およびベイジアン信念伝播が含まれます。グラフの最小スパニング ツリーは、生涯の最低コストまたは最小コストを表すことが多く、プリムのアルゴリズムとクラスカルのアルゴリズムがよく使用されます。コミュニティ発見、最短パス、トポロジカルソート、クリティカルパスにも対応するアルゴリズムがあります。
グラフアルゴリズムには、検索、照合、分類、評価などの多様なデータ解析技術が含まれますが、アルゴリズムの構造次元から、走査中心のアルゴリズムと計算中心のアルゴリズムの2つに大別されます。トラバーサル中心のアルゴリズムでは、特定の頂点から特定の方法でグラフをトラバースする必要があり、大量のランダム アクセスが発生します。計算中心のアルゴリズムは、反復サイクルで多数の演算を必要とし、データの局所性が比較的良好です。
グラフ計算により発生する消費電力に関しては、負荷変動によりシステム電力が変動し、山谷の時差が発生します。同時タスクが増加すると、ピーク対トラフの比率が変化し、消費電力が増加します。一般に、CPU 消費電力の点では、計算中心のアルゴリズムは命令ごとに平均して大量のエネルギーを消費しますが、トラバーサル中心のアルゴリズムは逆の効果があり、メモリ消費電力の点では、計算中心のアルゴリズムの方がメモリ消費量が少なくなります。平均エネルギー消費量は小さく、トラバーサル中心のアルゴリズムではその逆が当てはまります。
グラフ コンピューティング ベースのアプリケーションのほとんどはメモリに制限がありますが、コア コンポーネントの制限によってメモリ使用率が不十分になることもあります。十分なアクティブなスレッドにより同時アクセスが作成され、使用率が向上する可能性があります。より多くのスレッドが必要ですが、スレッド間の不均衡により、効率的に使用されない可能性があります。マルチコア プロセッサの高帯域幅メモリ使用量を最適化するには、よりスケーラブルな並列戦略を提供する必要があります。消費電力とエネルギー消費の動作は、命令の観点と頂点計算の観点では異なるため、正確な電力管理方法が必要であり、大幅な調整は効果的ではない可能性があります。
6. システムからグラフ計算を表示
大規模グラフ コンピューティング システムの使用シナリオとコンピューティング プラットフォーム アーキテクチャの違いに基づいて、それらは単一マシンのメモリ グラフに分類できます。コンピューティング システムおよび単一マシン外部メモリ グラフ コンピューティング システム コンピューティング システム、分散メモリ グラフ コンピューティング システム、および分散外部メモリ グラフ コンピューティング システム。
7.1 GNN VS MLP/CNN/RNN
グラフ データ内のノードの隣接ノードには 2 つの特性があります。1 つは不定の数であり、もう 1 つは順序が不確実であるためです。 MLP/CNN/RNN は、このような非ユークリッド データを直接処理することはできず、GNN でのみモデル化できます。実際、GNN はより一般的なモデルとみなすことができます。たとえば、RNN は線形グラフ上の GNN と同等であり、Transformer は完全なグラフ上の GNN と同等です。7.2 GNN VS グラフ埋め込み
GNN よりも前に多くのグラフ埋め込み手法が登場し、検索サービスのベクトル呼び出しフェーズで広く使用されています。 Word2vec による、オリジナルの Item2Vec から、均一性と構造のバランスの改善に基づく Node2Vec、グラフの不均一性の改善に基づく MetaPath2Vec、および行動データの希薄性を軽減するための属性データの導入に至るまで、これらのメソッドはすべてを備えています。スキップグラムパラダイムに従います。 これらの方法と比較すると、GNN はターゲット タスクと組み合わせてエンドツーエンドでトレーニングできますが、グラフ エンベディングは事前トレーニングに近く、学習するエンベディングは必ずしもターゲット タスクに関連しているわけではありません。特にサンプル サイズにおいて、大規模なビジネス シナリオでは、エンドツーエンド トレーニングで取得したエンベディングは、事前トレーニングで取得したエンベディングよりも効果的です。GNN の階層ネットワーク構造は、GCN Attentinotallow=GAT などの他の深層学習テクノロジと簡単に組み合わせることができます。 GNN は帰納的タスクに適用できます。つまり、グラフの構造が変更され、いくつかの新しいノードが追加された場合、グラフ埋め込みメソッドの場合はモデルを再トレーニングする必要があり、GNN は GraphSage Node と同様のメソッドを使用できます。すでにトレーニングされたモデルを使用したワイズ サンプリングは、新しいノードを直接推論し、メッセージ パッシング プロセスでさまざまな機能を使用できます。
7.3 GNN VS 特徴連結、協調フィルタリング、近接損失
特徴連結とは、特徴を結合し、特徴交差を通じて一次属性関連情報を学習することを意味します。協調フィルタリングは、ユーザーの履歴行動を通じて一次行動相関情報を学習することもできます。近接損失とは、隣接するノードをより類似させるために損失関数に規則的な項を追加することを意味しますが、一方ではそれは暗黙的な方法であり、他方では高次の類似関係を確実に学習したい場合は、以下を追加する必要があります。さらに複雑 K 次の正規項は、GCN が提案されたときの出発点の 1 つでもあります。これら3つの手法に比べ、GNNは複数の層を重ねることで高次の相関情報を明示的に学習することができます。
グラフ ニューラル ネットワークの設計では、順列不変性または順列等変性という重要な条件を満たす必要があります。つまり、設計された関数はノードの順序や入力の順序に影響されません。グラフ データを処理する場合、変換ドメインの出力は同じ順序になります。
8. 概要
グラフは最も柔軟な接続方法であり、エンティティを制限なく接続できます。グラフコンピューティングは、大量のデータの中からグラフデータを効率的に計算・保存・管理する方法を研究する分野で、資本市場のリスク管理、ライフサイエンス研究、医療提供、モニタリングなど幅広いビジネスシーンに応用できます。交通事故への対応、インテリジェントなインフラ管理など大規模データを効率的に処理するグラフコンピューティングは、ソーシャルネットワーク分析、セマンティックウェブ分析、生体情報ネットワーク分析、自然言語処理などの新たな応用分野の発展を促進します。
[参考資料]
「人工知能のグラフコンピューティング」清華大学人工知能研究所、北京知源人工知能研究所、清華工程学院知識知能共同研究センター、 2019- 2
https://www.php.cn/link/c9e5c2b59d98488fe1070e744041ea0e
https://www.php .cn /link/d40d35b3063c11244fbf38e9b55074be
https://www.php.cn/link/315f006f691ef2e689125614ea22cc61
https://www.php.cn/link/51d1cd3a02276948f566e6ea0a7d78cb
以上がグラフコンピューティングについて学び、考えるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

DDREASE は、ハード ドライブ、SSD、RAM ディスク、CD、DVD、USB ストレージ デバイスなどのファイル デバイスまたはブロック デバイスからデータを回復するためのツールです。あるブロック デバイスから別のブロック デバイスにデータをコピーし、破損したデータ ブロックを残して正常なデータ ブロックのみを移動します。 ddreasue は、回復操作中に干渉を必要としないため、完全に自動化された強力な回復ツールです。さらに、ddasue マップ ファイルのおかげでいつでも停止および再開できます。 DDREASE のその他の主要な機能は次のとおりです。 リカバリされたデータは上書きされませんが、反復リカバリの場合にギャップが埋められます。ただし、ツールに明示的に指示されている場合は切り詰めることができます。複数のファイルまたはブロックから単一のファイルにデータを復元します

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

Excel で複数の条件によるフィルタリングを使用する方法を知る必要がある場合は、次のチュートリアルで、データを効果的にフィルタリングおよび並べ替えできるようにするための手順を説明します。 Excel のフィルタリング機能は非常に強力で、大量のデータから必要な情報を抽出するのに役立ちます。設定した条件でデータを絞り込み、条件に合致した部分のみを表示することができ、データ管理を効率化できます。フィルター機能を利用すると、目的のデータを素早く見つけることができ、データの検索や整理の時間を節約できます。この機能は、単純なデータ リストに適用できるだけでなく、複数の条件に基づいてフィルタリングすることもできるため、必要な情報をより正確に見つけることができます。全体として、Excel のフィルタリング機能は非常に実用的です。

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

iPhone のモバイル データ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラー インターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する 場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください 修正 2 – データ モードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

今週、OpenAI、Microsoft、Bezos、Nvidiaが投資するロボット企業FigureAIは、7億ドル近くの資金調達を受け、来年中に自立歩行できる人型ロボットを開発する計画であると発表した。そしてテスラのオプティマスプライムには繰り返し良い知らせが届いている。今年が人型ロボットが爆発的に普及する年になることを疑う人はいないだろう。カナダに拠点を置くロボット企業 SanctuaryAI は、最近新しい人型ロボット Phoenix をリリースしました。当局者らは、多くのタスクを人間と同じ速度で自律的に完了できると主張している。人間のスピードでタスクを自律的に完了できる世界初のロボットである Pheonix は、各オブジェクトを優しくつかみ、動かし、左右にエレガントに配置することができます。自律的に物体を識別できる
