自己教師あり学習 (SSL) は、データラベルの手動入力を必要としない教師あり学習の形式です。人間の介入なしにデータを独自に分析し、情報にラベルを付け、分類するモデルを通じて結果が得られます。この方法により、手動アノテーションの作業負荷が軽減され、トレーニング効率が向上し、大規模なデータセットで適切に実行できます。 SSLは、コンピュータビジョンや自然言語処理など、さまざまな分野に応用できる有望な学習手法です。
自己教師あり学習は、ラベルなしのデータを使用して監視信号を生成する教師なし学習方法です。簡単に言うと、信頼性の高いデータ ラベルを生成してモデルをトレーニングし、これらのラベルを次の反復で使用します。反復ごとに、データ ラベルに基づくグラウンド トゥルースが変化します。このアプローチでは、ラベルのないデータを効果的に利用してモデルのパフォーマンスを向上させることができます。
#自己教師あり学習、教師あり学習、教師なし学習の関係 教師あり学習では、手動でラベル付けされた高品質のデータを使用して、モデルをトレーニングし、モデルの重みを調整します。 自己教師あり学習では、データと自動生成されたラベルを使用してモデルをトレーニングします。最初は実際のラベルはありません。 教師なし学習は、ラベルが利用できないデータ セットで機能します。この学習パラダイムは、トレーニングのどの段階でもラベルを使用せずに提供されたデータを理解しようとします。 自己教師あり学習は教師なし学習のサブセットであり、どちらも非構造化データのみを提供します。ただし、教師なし学習はクラスタリング、グループ化、次元削減に取り組みますが、自己教師あり学習は他の教師ありモデルと同様に分類、セグメンテーション、回帰などのタスクを実行します。 自己教師あり学習のフレームワーク タイプ エネルギーベース モデル (EBM) エネルギーのモデルに基づいて、数学関数を使用して、指定された 2 つの入力間の互換性を計算しようとします。 2 つの入力が与えられた場合、EBM が低エネルギー出力を生成する場合、それは入力の互換性が高いことを意味し、高エネルギー出力は非互換性が高いことを意味します。 ジョイント エンベディング アーキテクチャ ジョイント エンベディング アーキテクチャは、各ブランチの構造が同じ 2 つのブランチ ネットワークです。各ブランチには、個々の埋め込みベクトルを計算するための 2 つの入力が与えられます。ネットワークの先頭には、2 つの埋め込みベクトルを入力として受け取り、潜在空間内のそれらの距離を計算するモジュールがあります。 したがって、2 つの入力が互いに類似している場合、計算される距離は小さくなるはずです。ネットワーク パラメーターを簡単に調整して、潜在空間内の入力が互いに近くなるようにすることができます。 対比学習 対比学習SSLでは、テキスト、画像、動画などの「アンカー」と呼ばれる入力とクリップを比較します。モデルをトレーニングするための正の例と負の例。正のサンプルはアンカー ポイントと同じ分布に属するサンプルを指し、負のサンプルはアンカー ポイントとは異なる分布に属するサンプルを指します。 ノンコントラスト自己教師あり学習 (NC-SSL) ノンコントラスト自己教師あり学習 (NC-SSL) は、学習パラダイム: モデルのトレーニングには正のサンプル ペアのみが使用され、正と負のサンプル ペアの両方を使用する対照学習とは異なります。ただし、NC-SSL は、追加の予測子と勾配演算の停止を使用して、正のペアのみを含む非自明な表現を学習できることが示されています。以上が自己教師あり学習、教師あり学習、教師なし学習の関係と違い(自己教師あり学習フレームワークの分類)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。