Solar-10.7B微調整されたモデルチュートリアル-AI-php.cn

Solar-10.7B微調整されたモデルチュートリアル

尊渡假赌尊渡假赌尊渡假赌

リリース： 2025-03-08 09:21:09

オリジナル

968 人が閲覧しました

Solar-10.7B：非常に効率的な大型言語モデルに深く潜ります

ソーラー10.7Bプロジェクトは、大規模な言語モデル（LLM）開発における大幅な進歩を示しています。この記事では、その革新的なスケーリングアプローチ、パフォーマンスベンチマーク、実用的な使用、および潜在的なアプリケーションを調査しながら、その制限も認めています。

Solar-10.7b

の理解韓国のUpstage AIによって開発されたSolar-10.7bは、Llama-2アーキテクチャに基づいて構築された107億パラメーターモデルです。驚くべきことに、MixTral 8x7bを含む、大幅に大きなパラメーターカウントで他のLLMよりも優れています。 Llama-2の包括的な理解については、このモデルの微調整に関するガイドを参照してください。

微調整されたバージョンであるソーラー-10.7B-Instructバリアントは、次の複雑な指示に優れています。これは、特定のタスクのLLMSを調整するための微調整の力を強調しています。 Solar-10.7Bの背後にあるコアイノベーションは、その深度アップスケーリング（DUS）メソッドで、以下に詳述されています。

深度アップスケーリング：新しいスケーリング手法

DUSは、計算リソースを比例して増加させることなく、モデルの深さを増やすことができます。これにより、効率とパフォーマンスの両方が向上します。この方法は、Mistral 7Bウェイト、Llama 2フレームワーク、および連続前トレーニングの3つの重要なコンポーネントに依存しています。

N = 32、S = 48、およびM = 8の深さアップスケーリングのイラスト

2段階のプロセスは、深さごとのスケーリングと継続的なトレーニングを組み合わせています。（ソース）

SOLAR-10.7B Fine-Tuned Model Tutorial

プロセスには：

ベースモデル：

A 32層Llama 2モデルMistral 7bウェイトで初期化。

ベースモデルは、複製し、両方のコピーからレイヤーを削除し、それらを連結して望ましいレイヤーカウントを達成することにより拡大されます（たとえば、32層のベースから48レイヤー）。継続事前トレーニング：
このマルチステージアプローチにより、ソーラー10.7bははるかに大きなモデルの機能に一致またはそれを超えることができ、費用対効果の高い強力なオプションになります。ソーラー-10.7b-instruct：
ソーラー-10.7b-instructは、複雑な命令解釈のために特別に調整されています。これは、数学的推論を改善するために、オープンソースデータセットと合成された数学データセットを使用して微調整することで達成されます。 Llama-2アーキテクチャのモデルの基盤は、速度と精度のバランスを提供します。微調整されたモデルのアプリケーション

パーソナライズされた教育：個々の学習スタイルに適応するインテリジェントな個別指導システムを作成します。
カスタマーサポート：コンプレックスクエリを処理できる電源高度なチャットボット
自動コンテンツの作成：さまざまな形式の書面によるコンテンツを生成し、長いドキュメントを要約します。 を使用するための実用的なガイド

このセクションでは、Solar-10.7B-Instruct V1.0 GGUFモデルを使用するための段階的なガイドを提供します。

1。インストール：

2。インポートライブラリ：

pip -q install transformers==4.35.2
pip -q install accelerate

ログイン後にコピー

3。 GPU構成：

GPUが有効になっていることを確認します（たとえば、Google Colabのランタイム設定を使用）。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

ログイン後にコピー

。

で確認します 4。モデルの定義：!nvidia-smi

5。モデルの推論と結果生成：

model_ID = "Upstage/SOLAR-10.7B-Instruct-v1.0"
tokenizer = AutoTokenizer.from_pretrained(model_ID)
model = AutoModelForCausalLM.from_pretrained(model_ID, device_map="auto", torch_dtype=torch.float16)

ログイン後にコピー

制限

強力ですが、ソーラー10.7bには制限があります：

user_request = "What is the square root of 24?"
conversation = [{'role': 'user', 'content': user_request}]
prompt = tokenizer.apply_chat_template(conversation, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, use_cache=True, max_length=4096)
output_text = tokenizer.decode(outputs[0])
print(output_text)

ログイン後にコピー

ハイパーパラメーターの最適化：

DUSには、より広範なハイパーパラメーター探査が必要です。