ホームページ テクノロジー周辺機器 AI Pytorch' s Torchchatチュートリアル:Pythonを使用したローカルセットアップ

Pytorch' s Torchchatチュートリアル:Pythonを使用したローカルセットアップ

Mar 04, 2025 am 09:21 AM

Torchchat:ローカルマシンに大きな言語モデルの推論をもたらす

大規模な言語モデル(LLMS)はテクノロジーを変換していますが、個人のデバイスにそれらを展開することは、ハードウェアの制限のために困難でした。 Pytorchの新しいTorchchatフレームワークはこれに対処し、ラップトップからモバイルデバイスまで、さまざまなハードウェアプラットフォームで効率的なLLM実行を可能にします。 この記事では、PythonでTorchchatをローカルにセットアップして使用するための実用的なガイドを提供します。 FacebookのAI Research Labの(公正な)オープンソースの機械学習フレームワーク、Torchchatを支えるPytorch Torchchatの主要な機能:

Torchchatには、4つのコア機能があります。

python/pytorch llm実行:
    PythonとPytorchがインストールされたマシンでLLMを実行し、端末またはREST APIサーバーを介して直接対話します。 この記事では、このセットアップに焦点を当てています
  1. 自己完結型モデルの展開:aotインダクタ(先行インダクタ)を利用して、TorchchatはPythonとPytorchとは無関係に自己完結型の実行可能ファイル(動的ライブラリ)を作成します。これにより、再コンパイルなしの生産環境での安定したモデルのランタイムが保証されます。 AOTインダクタは、効率的なバイナリ形式を介して展開を最適化し、Torchscriptのオーバーヘッドを上回ります。
  2. モバイルデバイスの実行:executorchを活用して、Torchchatはモバイルおよび埋め込みデバイスのモデルを最適化し、実行するためのPTEアーティファクトを生成します。
  3. モデルの評価:
  4. 研究とベンチマークには重要なフレームワークを使用してLLMパフォーマンスを評価します。
  5. なぜLLMSをローカルに実行するのですか?
  6. ローカルLLM実行には、いくつかの利点があります: lm_eval
プライバシーの強化:

ヘルスケア、財務、および法律セクターの機密データに最適であり、組織インフラストラクチャ内にデータが残るようにします。

リアルタイムのパフォーマンス:

インタラクティブなチャットボットやリアルタイムコンテンツ生成など、迅速な応答が必要なアプリケーションのレイテンシを最小限に抑えます。
  • オフライン機能:インターネット接続が限られている、または無限のエリアでLLMの使用を有効にします。>
  • コストの最適化:大量のアプリケーションでのクラウドAPIの使用よりも費用対効果が高い。>
  • Pythonを使用したローカルセットアップ:ステップバイステップガイド
  • リポジトリをクローンします:git:を使用してtorchchatリポジトリをクローンします
代わりに、githubインターフェイスから直接ダウンロードします。

  1. インストール:
    git clone git@github.com:pytorch/torchchat.git
    ログイン後にコピー
    ログイン後にコピー
    Python 3.10がインストールされていると仮定し、仮想環境を作成します:

    指定されたスクリプトを使用して、依存関係をインストールします:

    PyTorch's torchchat Tutorial: Local Setup With Python

    インストールの確認:
  2. git clone git@github.com:pytorch/torchchat.git
    ログイン後にコピー
    ログイン後にコピー
  3. TorchChatを使用:

    • サポートされているモデルのリスト:

      python -m venv .venv
      source .venv/bin/activate
      ログイン後にコピー

      PyTorch's torchchat Tutorial: Local Setup With Python

    • モデルのダウンロード:hugging hugging hugging face cli(pip install huggingface_hub)をインストールし、ハグするフェイスアカウントを作成し、アクセストークンを生成し、ログイン(huggingface-cli login)にログインします。モデルをダウンロードしてください(例:stories15M):

      ./install_requirements.sh
      ログイン後にコピー
    • モデルの実行:テキストを生成:

      python torchchat.py --help
      ログイン後にコピー

      またはチャットモードを使用してください:

      python torchchat.py list
      ログイン後にコピー
    • アクセスのリクエスト:)、エラーメッセージの指示に従ってください。 llama3

    PyTorch's torchchat Tutorial: Local Setup With Python

  4. 高度な使用法:微調整パフォーマンス

    精密制御(
  • ):速度/精度のトレードオフのデータ型を調整します(例:--dtype)。 --dtype fastJust-in-time(jit)compilation():
  • 推論速度が向上します(ただし、スタートアップ時間が増加します)。
  • Quantization(): Model Sizeを縮小し、JSON構成ファイルを使用して速度を向上させます。 --compileデバイスの仕様(
  • ):
  • デバイスを指定します(例えば、--quantize 結論
  • TorchchatはローカルLLMの実行を簡素化し、高度なAIをよりアクセスしやすくします。このガイドは、その機能を調査するための基盤を提供します。 Torchchatの機能に関するさらなる調査を強くお勧めします

以上がPytorch' s Torchchatチュートリアル:Pythonを使用したローカルセットアップの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Meta Llama 3.2を始めましょう - 分析Vidhya Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

10生成AIコーディング拡張機能とコードのコードを探る必要があります 10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5など AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5など Apr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

従業員へのAI戦略の販売:Shopify CEOのマニフェスト 従業員へのAI戦略の販売:Shopify CEOのマニフェスト Apr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

GPT-4o vs Openai O1:新しいOpenaiモデルは誇大広告に値しますか? GPT-4o vs Openai O1:新しいOpenaiモデルは誇大広告に値しますか? Apr 13, 2025 am 10:18 AM

導入 Openaiは、待望の「Strawberry」アーキテクチャに基づいて新しいモデルをリリースしました。 O1として知られるこの革新的なモデルは、推論能力を強化し、問題を通じて考えられるようになりました

ビジョン言語モデル(VLM)の包括的なガイド ビジョン言語モデル(VLM)の包括的なガイド Apr 12, 2025 am 11:58 AM

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

最高の迅速なエンジニアリング技術の最新の年次編集 最高の迅速なエンジニアリング技術の最新の年次編集 Apr 10, 2025 am 11:22 AM

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

ラマ3.2を実行する3つの方法-Analytics Vidhya ラマ3.2を実行する3つの方法-Analytics Vidhya Apr 11, 2025 am 11:56 AM

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

See all articles