自己教師あり学習 (SSL) は、ラベルなしのデータを使用してモデルをトレーニングする教師なし学習の方法です。中心的なアイデアは、人間によるラベルなしでデータの表現をモデルに学習させることです。モデルがデータの表現方法を学習すると、ラベルの少ないデータを使用する下流タスクに適用でき、自己教師あり学習を行わないモデルよりも優れたパフォーマンスを達成できます。自己教師あり学習を通じて、モデルはデータ内の暗黙的な情報を使用して、たとえばデータの回転や色の変化などを予測することで学習できます。この手法は、ラベル付きデータが存在しない場合でも効果的な学習手法を提供することができ、大規模なデータ学習の問題を解決する上で非常に重要です。
1. データの理解に基づいて、ラベルのないデータから入力データとラベルをプログラムで生成します
2. 事前トレーニング: トレーニング前のステップのデータ/ラベルを使用したモデル
3. 微調整: 事前トレーニングされたモデルを初期重みとして使用して、対象のタスクをトレーニングします
自己教師あり学習 (SSL) のカテゴリ
情報を復元する 非自己回帰: マーカー/ピクセルをマスクし、マスクされたマーカー/ピクセルを予測します (例: マスクされた言語モデリング (MLM))
b.自己回帰: 次のトークン/ピクセルを予測します。相対位置、次のセグメントが次の文であるかどうかを予測します)
b: クラスター内の各サンプルの ID を予測します
c: 画像の回転を予測します角度
3. 比較学習 (別名対比インスタンス識別): 拡張によって作成された正と負のサンプルのペアに基づいてバイナリ分類問題を確立する
4. ブートストラップ法: 2 つの似ているが異なるネットワークを使用する同じサンプルの拡張ペアから学習する 同じ表現
##5. 正則化: 仮定/直観に基づいて損失項と正則化項を追加します:a: 正のペアは類似している必要がありますb: 同じバッチ内で異なるサンプルの出力は異なるはずです以上がSSL の自己教師あり学習メソッドの詳細な調査の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。