LoRA をご紹介します: LLM の完全なトレーニングルーチンよりも賢く、高速で、はるかに安価な AI ハックです。-Python チュートリアル-php.cn

LoRA をご紹介します: LLM の完全なトレーニングルーチンよりも賢く、高速で、はるかに安価な AI ハックです。

DDD

リリース： 2025-01-23 02:40:12

オリジナル

498 人が閲覧しました

Meet LoRA: The AI Hack That’s Smarter, Faster, and Way Cheaper Than Your LLM’s Full Training Routine!

LoRA (低ランク適応) は、従来の完全なモデルのトレーニングと比較して、大規模言語モデル (LLM) を微調整するための大幅に効率的な方法を提供します。 LoRA では、すべてのモデルの重みを調整するのではなく、元のモデルの重みをそのままにしたまま、小さなトレーニング可能な行列を導入します。これにより、計算需要とメモリ使用量が大幅に削減され、リソースに制約のある環境に最適です。

LoRA の仕組み:

LoRA は低ランク行列分解を利用します。微調整中に必要な重み調整は低ランクの行列で表現できると想定しています。これらの行列は元のモデルの重みよりも大幅に小さいため、効率が大幅に向上します。このプロセスには以下が含まれます:

分解: 重みの更新は、より小さい低ランクの行列のペアに分解されます。
統合: これらの小さいトレーニング可能な行列は、多くの場合、トランスフォーマーモデルのアテンションメカニズム内で、特定のモデルレイヤーに追加されます。
推論/トレーニング: 推論とトレーニングの両方で、これらの低ランク行列は、元の固定された重みと結合されます。

LoRA を使用する利点:

計算コストの削減: トレーニングと推論が高速になり、必要な計算能力が少なくなるため、リソースが限られたデバイス (VRAM の低い GPU など) に適しています。
効率の向上: 更新されるパラメーターが減り、トレーニング時間が短縮されます。
拡張性の向上: LoRA パラメーターの異なるセットを保存するだけで、同じ基本モデルを使用して複数のタスクを微調整でき、モデル全体を複製する必要がなくなります。
柔軟性: LoRA のモジュラー設計により、事前トレーニングされた LoRA アダプターをさまざまな基本モデルおよびタスクと組み合わせることができます。

コードの実装を見てみましょう。

まず、必要なライブラリをインストールします。

pip install transformers peft datasets torch

ログイン後にコピー

これにより、transformers、peft、datasets、および torch がインストールされます。次に、Python スクリプトを調べてみましょう:

pip install transformers peft datasets torch

ログイン後にコピー

このスクリプトは、基本モデルの読み込み、LoRA の適用、データセットの準備、トレーニングパラメーターの定義、トレーニングプロセスの開始といった主要な手順を示しています。 compute_loss クラス内の CustomTrainer メソッド (トレーニングに重要) は簡潔にするために省略されていますが、通常はクロスエントロピー損失の計算が含まれることに注意してください。微調整されたモデルの保存も明示的には示されていませんが、trainer.save_model() メソッドの使用が必要になります。選択したモデルのアーキテクチャに基づいて、target_modules 内の LoraConfig を忘れずに調整してください。この合理化された例は、LoRA のアプリケーションの概要を明確に示しています。

以上がLoRA をご紹介します: LLM の完全なトレーニングルーチンよりも賢く、高速で、はるかに安価な AI ハックです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。