グラフ埋め込みアルゴリズムに関する簡単な説明-AI-php.cn

グラフ埋め込みアルゴリズムに関する簡単な説明

#パート 01

##● ##グラフ埋め込みとは ●

グラフの埋め込みは、グラフ構造データを低次元の密なベクトルにマッピングするプロセスです。同時に、元のグラフ内で類似した位相構造または近い属性を持つノードもベクトル内で近い位置に配置されます。グラフ構造のデータを機械学習アルゴリズムに効率的に入力することが難しいという問題を効果的に解決します。

#グラフの表現と保存については、隣接行列を使用することが最も簡単に考えられます。グラフ内の各ノードに番号を付けて、

の行列を構築します。ここで、グラフ埋め込みアルゴリズムに関する簡単な説明はノードの数を表します。グラフ内の 2 つのノードがエッジで接続されているかどうかによって、隣接行列内の対応する位置の値が決まります。この表現方法は非常に理解しやすく直感的ですが、非常に非効率です。実際のシナリオでは、グラフには数千またはそれ以上のノードが含まれる可能性があり、ほとんどのノードはエッジで接続されていないため、結果として得られる隣接行列が非常にまばらになります。隣接行列を使用してグラフを表現および保存するには、高い計算コストとスペースコストが必要ですが、グラフ埋め込みアルゴリズムを使用すると、グラフ分析の問題を効率的に解決できます。グラフ埋め込みアルゴリズムに関する簡単な説明

#パート 02

##●

基本概念 ● コンセプト 1 画像:

グラフはグラフ埋め込みアルゴリズムに関する簡単な説明として表されます。はノードを表します。エッジを表します。 #ノードタイプマッピング機能付きおよびエッジタイプマッピング機能# ＃＃＃＃＃関連する。はノードタイプのコレクションを表し、グラフ埋め込みアルゴリズムに関する簡単な説明はエッジタイプのコレクションを表します。 #コンセプト 2 同型グラフ:

#グラフ

## ＃＃＃＃＃＃＃、で＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃。つまり、すべてのノードは 1 つのタイプに属し、すべてのエッジは 1 つのタイプに属します。たとえば、ソーシャルネットワークのユーザー注目関係グラフには、ノードタイプ (ユーザー) とエッジタイプ (注目関係) が 1 つだけあります。

#コンセプト 3 異種グラフ: グラフ埋め込みアルゴリズムに関する簡単な説明 #グラフ #、

または

。つまり、複数のノードタイプまたはエッジタイプが存在します。たとえば、学術ネットワークのグラフ構造には、論文、著者、会議などの複数のノードタイプが存在します。エッジ関係には、それらの間の創造的な関係が含まれます。著者と論文、論文と学会、それらの間の出版関係、論文間の引用関係など。グラフ埋め込みアルゴリズムに関する簡単な説明コンセプト 4 一次類似性:

2 つのノードを接続するエッジの重みが大きいほど、それらの間の一次類似度は大きくなります。ノードグラフ埋め込みアルゴリズムに関する簡単な説明とノードの間の一次類似度は ## と表されます。 #、があります。はノード ## です。 # とノードの間のエッジの重み。

#概念 5 二次類似度:

2 つのノードが隣接している場合ネットワーク構造が類似しているほど、構造間の 2 次類似性が高くなります。ノード

# とノードグラフ埋め込みアルゴリズムに関する簡単な説明 # # の間の 2 次類似度# は、と # の近隣です。 ## の近隣地域間の類似性。図 1 に示すように、ノード f とノード g を接続するエッジがあるため、ノード f とノード g は一次相似になります。ノード e とノード g を接続するエッジはありませんが、ノード e とノード g には 4 つの同一の隣接ノードがあるため、ノード e とノード g は二次的に類似します。グラフ埋め込みアルゴリズムに関する簡単な説明

グラフ埋め込みアルゴリズムに関する簡単な説明

#図 1 二次相似図

概念 6 図の埋め込み:

入力グラフと事前定義された埋め込み次元が与えられた場合、グラフの埋め込みとは、グラフのプロパティを可能な限り保持しながら、グラフを次元空間に変換することです。グラフを表すために次元ベクトルまたはグラフ埋め込みアルゴリズムに関する簡単な説明次元ベクトルのセットを使用して、一次類似度または高次類似度に基づいてグラフ属性の保存度を定量化します。、各ベクトルはノードやエッジなどのグラフの一部の埋め込みを表します。

##パート 03

##●

#グラフ埋め込みアルゴリズムの分類#● 過去数十年にわたり、研究者たちは多くの優れたアルゴリズムを提案しており、ソーシャルネットワーク、通信ネットワーク、その他のシナリオに大きな効果があることが証明されています。業界では通常、出力粒度の違いに基づいて、これらのグラフ埋め込みアルゴリズムを次の 3 つのカテゴリに分類します。

# (1) ノード埋め込み

ノードの埋め込みは、最も一般的なタイプです。グラフ内の各ノードは、低次元空間のベクトルによって表されます。「類似した」ノードの埋め込みベクトル表現も同様です。グラフ内のノードを分析し、ノードの分類やノードのクラスタリングなどのタスクを実行する必要がある場合、通常はノードの埋め込みが選択されます。

(2) エッジ埋め込み

ベクトルを使用してグラフを低次元でマッピングするspace の各エッジが表現されます。エッジはノードのペアで構成され、通常はノードとペアの関係を表します。エッジの埋め込みは、グラフ内のエッジを分析し、ナレッジグラフの関係予測やリンク予測などのタスクを実行する必要がある場合に適しています。

(3) グラフの埋め込み

低次元空間のベクトルを使用して埋め込みますA 表現全体は図、通常は分子やタンパク質などの小さな図によって表されます。グラフをベクトルとして表すと、異なるグラフ間の類似性の計算が容易になり、グラフの分類問題が解決されます。

異なるタスク要件により、選択されるグラフ埋め込みアルゴリズムが決まります。スペースの都合により、ここではノード埋め込みにおける DeepWalk アルゴリズムと Node2Vec アルゴリズムを抜粋して詳細な調査を比較します。

#パート 04

##●

クラシックなグラフ埋め込みアルゴリズム ● #1.DeepWalk アルゴリズム

自然言語処理の分野における word2vec のアイデアに触発され、Perozzi et al.ノード表現ベクトルのモデル化により、ノード間の共起関係をコーパス内の単語間の共起関係に類推し、DeepWalkアルゴリズムを提案する。グラフ内のノードの隣接ノードのシーケンスは、ノードコンテキストのコーパスに相当するランダムウォークによって収集され、グラフ内のノード間の共起関係を抽出する問題を解決できます。ノードシーケンスの長さと開始点を事前に設定します。ランダムウォーク戦略は、隣接ノードの中から次の歩行ノードを決定する方法を示します。この手順を繰り返して、条件を満たすシーケンスを取得します。ランダムウォークダイアグラムを図に示します。 2. 表示します。

グラフ埋め込みアルゴリズムに関する簡単な説明

図 2 ランダムウォークの概略図

word2vec アルゴリズムの単語は対応しますグラフ内のノードグラフ埋め込みアルゴリズムに関する簡単な説明 # に、単語列はランダムウォークによって得られたノード列に対応し、ランダムウォーク # では、式に示すように最適化目的関数を定義します。

グラフ埋め込みアルゴリズムに関する簡単な説明

#ノードの潜在的な特徴表現をさらに学習するために、DeepWalk アルゴリズムにはマッピング関数が導入されていますグラフ埋め込みアルゴリズムに関する簡単な説明、グラフ内のノードの # 次元ベクトルへのマッピングを実現するには、問題は可能性の推定に変換されます。次の式の。

グラフ埋め込みアルゴリズムに関する簡単な説明

#確率の計算では、word2vec アルゴリズムのスキップグラムモデルも参照する必要があります。

#図 3 に示すように、スキップグラムモデルには 2 つのキー行列が含まれており、1 つは中心単語ベクトル行列です。

、もう 1 つは背景単語ベクトル行列グラフ埋め込みアルゴリズムに関する簡単な説明これら 2 つの重み行列はそれぞれ、単語が異なる役割を果たすときに単語に関連付けられた単語ベクトルを表します。。 Skip-gram は単語の文脈を予測するためのモデルであり、まずコーパスから単語間の関係を学習し、次にその関係を使用して特定の単語の文脈、つまり単語のベクトル表現を表現します。つまり、同じシーケンス内で 2 つの単語が同時に出現する頻度が高くなるほど、2 つの単語のベクトル表現はより類似します。この考え方をグラフに適用し、式に示すように最適化目的関数を定義します。グラフ埋め込みアルゴリズムに関する簡単な説明

#ランダムウォークプロセスでは、サンプリングシーケンス内のノード間の順序関係は考慮されません。これにより、より良い可能性があります。ノードの近接関係を効果的に反映し、計算コストを削減します。グラフ埋め込みアルゴリズムに関する簡単な説明

#図 3 スキップグラムモデル図

グラフ埋め込みアルゴリズムに関する簡単な説明

2.Node2Vec アルゴリズム

研究者 Grover A と Leskovec J は、DeepWalk アルゴリズムに基づいて Node2Vec アルゴリズムを提案しました。 Node2Vec アルゴリズムは、DeepWalk アルゴリズムのランダムウォークを通じてノードシーケンスを生成するプロセスを最適化し、パラメーターグラフ埋め込みアルゴリズムに関する簡単な説明とパラメーター # を定義します。 ##各ランダムウォークが幅優先サンプリングか深さ優先サンプリングのどちらの傾向にあるかをガイドし、適応性が高くなります。現在ノードグラフ埋め込みアルゴリズムに関する簡単な説明 # を訪問していると仮定すると、次にノード # を訪問する確率は次の式のようになります。。

グラフ埋め込みアルゴリズムに関する簡単な説明

ここで、はスレーブノードを表します。ノードグラフ埋め込みアルゴリズムに関する簡単な説明への遷移確率。は正規化定数を表します。

図 4 Node2Vec ランダムウォーク戦略図

Node2Vec のランダムウォーク戦略は、図 4 に示すように 2 つのパラメーターに基づいて制御されます。エッジグラフ埋め込みアルゴリズムに関する簡単な説明を介してノード v に到達し、次のステップでノード x にアクセスすると仮定します。はノードとの間のエッジの重みです。。つまり、グラフが重み付けされていないグラフの場合、グラフ埋め込みアルゴリズムに関する簡単な説明はノードの遷移確率を直接決定します。グラフが重み付きグラフの場合、とエッジの重みの積により、最終的な遷移確率が決まります。ノードの。は次の式に従って計算できます。グラフ埋め込みアルゴリズムに関する簡単な説明はノード # です。 ## とノードの間の最短パス距離。 #歩行サンプルがノード

からノード ## に移動するとき#ネクストホップノードを選択する必要がある場合、次の 3 つの状況が考えられます。グラフ埋め込みアルゴリズムに関する簡単な説明 (1)

の場合、ノード

# を返す＃＃＃＃。グラフ埋め込みアルゴリズムに関する簡単な説明

(2) グラフ埋め込みアルゴリズムに関する簡単な説明の場合、ノードとノード # Common を選択します## の隣接ノード (ノードなど)。

(3) グラフ埋め込みアルゴリズムに関する簡単な説明の場合、ノードを選択します無関係なノードに隣接するノード (ノードや # など) 。

つまり、パラメータグラフ埋め込みアルゴリズムに関する簡単な説明は、前のホップノードに戻る確率を制御します。パラメーターは、ネットワークのローカル構造情報を調査するか、グローバル構造情報を調査するかを詳細に制御します。DeepWalk モデルは、実際には ## です。 # およびグラフ埋め込みアルゴリズムに関する簡単な説明の値が 1 に設定されている場合の Node2Vec モデル。

#パート 05

##●

#概要 ##●

情報技術の急速な発展に伴い、ネットワーク環境はますます複雑化し、ネットワーク攻撃が多発しており、その中でもAPT攻撃が多発しており、企業が求めるセキュリティ課題となっています。注意を払う。実際、APT 攻撃が発生する基本環境であるネットワーク自体は、コンピュータやその他の要素から構成されるネットワーク構造であり、これらの要素間の関係をグラフデータ構造で表現し、攻撃を変形させることを考えることは難しくありません。検出問題をグラフ内のノード、エッジ、またはサブグラフ分類タスクに組み込みます。グラフの埋め込みは、多くの研究余地がある豊富な問題です。モデルのトレーニング効率を向上させ、モデルの構築方法を革新し、グラフ埋め込みのアイデアをより多くの生産実践に適用する方法についてです。企業は、より良いソリューションを見つけるためにさらなる研究が必要です。回答。

参考文献

[1]Xu M. グラフ埋め込み手法とその応用について[J]. SIAM Review, 2021, 63(4): 825-853.

[2]Cai H、Zheng V W、Chang K C C . 包括的なグラフ埋め込みの調査: 問題、技術、およびアプリケーション[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(9): 1616-1637.

##[3]Goyal P、Ferrara E. グラフ埋め込み技術、アプリケーション、およびパフォーマンス: 調査[J]. Knowledge-Based Systems, 2018, 151: 78-94. #

以上がグラフ埋め込みアルゴリズムに関する簡単な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。