JoyCaption を使用したマルチ GPU バッチ キャプション。 JoyCaption は、Meta-Llama-3.1–8B、google/siglip-so400m-patch14–384、および微調整された画像キャプション ニューラル ネットワークを使用します。
リンク: https://www.patreon.com/posts/110613301
バッチキャプションエディターへのリンク: https://www.patreon.com/posts/108992085
Python、Torch、ビットサンドバイトでマルチ GPU をコーディングするのは、本当に挑戦でした。
私たちのアプリは、JoyCaption 画像キャプションの微調整されたモデルを使用しています。
当社のアプリは、マルチ GPU モード (9.5 GB VRAM) でもビットサンドバイト 4 ビット モデルの読み込みをサポートしています
8x RTX A6000 (クラウド) および RTX 3090 TI + RTX 3060 (私の PC) でテスト済み
1 クリックで Windows、RunPod、Massed Compute にインストール
優れたキャプション品質、画像を各 GPU に自動的に配信するなど、多くの機能を備えています。キャプション付き画像をスキップするオプションを使用してキャプションを再開できます。
詳細については、スクリーンショットをご覧ください
以上が初めて完全にマルチ GPU をサポートし、Gradio インターフェイスを備えた非常に高度なバッチ画像キャプション アプリが公開されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。