安定性AIは、2024年2月に安定した拡散3の早期プレビューを発表しました。AIモデルはまだプレビュー中ですが、2024年4月に、チームは、Firworks AIと提携した後、安定性AI開発者プラットフォームAPIで安定したAI開発者プラットフォームで安定した拡散3と安定した拡散3ターボを利用できると発表しました。
安定した拡散3は、単に一連のテキストからイメージまでの生成AIモデルであることに注意してください。 Stability AIのチームによると、モデルは、OpenaiのDall-E 3やMidjourney V6などの他のテキストからイメージまでのジェネレーターを「タイポグラフィと迅速なアドヒアランス」に "なぜ安定した拡散3?
安定した拡散3は、特にテキスト生成の改善と迅速な能力の観点から、テキストからイメージの生成スペースでそれを非常に競争力のあるものにするいくつかの進歩と機能を紹介します。これらの進歩を探りましょう:
ステップ3:クレジットのトッピング。 APIをリクエストするクレジットが必要です。クレジットは、APIを呼び出すときに消費される通貨単位です。消費される量は、モデルとモダリティによって異なります。すべてのクレジットを使い果たした後、請求ダッシュボードから100クレジットごとに1ドルでさらに購入できます。 このチュートリアルでは、Google ColabとComfyuiを使用して、安定した拡散3 APIを使用して画像を生成する方法を示します。次のセクションでは、各ツールの使用を開始する手順をカバーします。 Google Colabを使用して、安定した拡散3 APIを使用して
Google Colabを開始するには、Googleアカウントを作成する必要があります。リンクをクリックして指示に従ってください。
すでにGoogleアカウントをお持ちの場合は、新しいノートブックを開き、以下の手順に従ってください。注:この例で使用されているコードは、安定性AIによってSD3_APIチュートリアルから取得されます。
ステップ1:要件をインストールします
ステップ2:安定性APIに接続します ステップ3。関数を定義します
ステップ4。画像を生成します
from io import BytesIO import IPython import json import os from PIL import Image import requests import time from google.colab import output
sd3:
は6.5クレジットを使用しますimport getpass # To get your API key, visit https://platform.stability.ai/account/keys STABILITY_KEY = getpass.getpass('Enter your API Key')
sd3ターボ:4クレジット
を使用しますdef send_generation_request( host, params, ): headers = { "Accept": "image/*", "Authorization": f"Bearer {STABILITY_KEY}" } # Encode parameters files = {} image = params.pop("image", None) mask = params.pop("mask", None) if image is not None and image != '': files["image"] = open(image, 'rb') if mask is not None and mask != '': files["mask"] = open(mask, 'rb') if len(files)==0: files["none"] = '' # Send request print(f"Sending REST request to {host}...") response = requests.post( host, headers=headers, files=files, data=params ) if not response.ok: raise Exception(f"HTTP {response.status_code}: {response.text}") return response
テストしましょう。 この例では、低地の熱帯地域にトゥーカンの鳥の画像を作成します。
これが作成されたものです:
# SD3 prompt = "This dreamlike digital art captures a vibrant, Toucan bird in a lowland tropic area" #@param {type:"string"} negative_prompt = "" #@param {type:"string"} aspect_ratio = "1:1" #@param ["21:9", "16:9", "3:2", "5:4", "1:1", "4:5", "2:3", "9:16", "9:21"] seed = 0 #@param {type:"integer"} output_format = "jpeg" #@param ["jpeg", "png"] host = f"https://api.stability.ai/v2beta/stable-image/generate/sd3" params = { "prompt" : prompt, "negative_prompt" : negative_prompt, "aspect_ratio" : aspect_ratio, "seed" : seed, "output_format" : output_format, "model" : "sd3", "mode" : "text-to-image" } response = send_generation_request( host, params ) # Decode response output_image = response.content finish_reason = response.headers.get("finish-reason") seed = response.headers.get("seed") # Check for NSFW classification if finish_reason == 'CONTENT_FILTERED': raise Warning("Generation failed NSFW classifier") # Save and display result generated = f"generated_{seed}.{output_format}" with open(generated, "wb") as f: f.write(output_image) print(f"Saved image {generated}") output.no_vertical_scroll() print("Result image:") IPython.display.display(Image.open(generated))
comfyui でAPIを使用します
ステップ1.1:
このgithubリポジトリからcomfyuiのスタンドアロンバージョンをダウンロード - リンクをクリックすると、ダウンロードが開始されます。 ステップ1.2:最新のcomfyui-windows.zipファイルをダウンロードしたら、7-zipやwinrarなどのユーティリティを使用して抽出します。 ステップ1.3:
Comfyuiの使用を開始するには、チェックポイントモデルが必要です。安定した拡散または抱きしめの顔からチェックポイントモデルをダウンロードできます。モデルをフォルダーに入れます:ステップ1.4:
ここで、run_nvidia_gpu.bat(推奨)またはrun_cpu.batを実行するだけです。これにより、ブラウザでComfyuiを自動的に開始する必要があります コマンドラインは、ブラウザで開くことができるURL http://127.0.1:8188/を実行して生成します。 ステップ2:comfyuiマネージャー
をインストールしますfrom io import BytesIO import IPython import json import os from PIL import Image import requests import time from google.colab import output
これはコマンドプロンプト端末を開く必要があります。ここでは、次のコマンドを挿入する必要があります。 完了したら、Comfyuiを再起動します。新しい「
マネージャー」ボタンがフローティングパネルに表示されます。
ステップ3:安定性AI APIノードをインストールします」に移動して、「
stability api。」
を検索します。import getpass # To get your API key, visit https://platform.stability.ai/account/keys STABILITY_KEY = getpass.getpass('Enter your API Key')
このステップはオプションですが、お勧めします。つまり、安定性AIカスタムノード内の各ノードの安定性AI APIキーを設定できます。これにより、すべてのワークフローでAPIキーを繰り返し入力する必要がなくなり、ワークフローJSONファイルを共有するときにAPIキーを不注意に共有するリスクが低下します。
そうするために、カスタムノードディレクトリに移動します:
from io import BytesIO import IPython import json import os from PIL import Image import requests import time from google.colab import output
ステップ5:ワークフローをロードして実行します
トラブルシューティングとヒント
他のツールと同様に、途中でいくつかの問題に遭遇する可能性が常にあります。 APIまたはセットアッププロセスの問題に直面しているユーザーのための最も一般的な課題とトラブルシューティング手順は次のとおりです。
トラブルシューティング:APIキーをダブルチェックし、コピーして正しく貼り付けていることを確認します。キーに余分なスペースや文字がないことを確認してください。 Stable Diffusion 3サーバーによってAPIキーが適切に認証されていることを確認してください。 クレジット管理の問題
チャレンジ:ユーザーは、クレジットの不十分なクレジットや請求エラーなど、クレジット管理に関連する問題に遭遇する可能性があります。
接続性とネットワークの問題
チャレンジ:ユーザーは、APIにアクセスできないように接続性の問題またはネットワーク中断を経験する場合があります。 トラブルシューティング:
安定したインターネット接続があり、ネットワークの中断がないことを確認してください。問題を分離するには、別のネットワークまたはデバイスからAPIにアクセスしてみてください。接続性の問題を引き続き経験している場合は、インターネットサービスプロバイダーにお問い合わせください。チャレンジ:
ユーザーは、必要なツールとライブラリをインストールまたは使用する際に、互換性の問題や依存関係エラーに遭遇する場合があります。トラブルシューティング:安定した拡散3 APIの互換性要件を確認し、互換性のあるバージョンのツールとライブラリを使用していることを確認してください。エラーを引き起こしている依存関係を更新または再インストールします。トラブルシューティングガイダンスについては、ドキュメントとコミュニティフォーラムを参照してください。
チャレンジ:ユーザーは、特にピーク使用時間中にAPIと対話するときに、応答時間やパフォーマンスの問題が遅い場合があります。
トラブルシューティング: APIのパフォーマンスと追跡回答時間を監視して、パターンまたはトレンドを特定します。パフォーマンスと優先度の高いアクセスを改善するために、より高い層のサブスクリプション計画にアップグレードすることを検討してください。一貫して遅い応答時間がある場合は、サポートチームに連絡してください。
ドキュメントとサポートチャレンジ:ユーザーは、APIドキュメントを理解するのが難しい場合や、特定の問題のトラブルシューティングの支援が必要な場合があります。
トラブルシューティング:APIの使用、トラブルシューティング、ベストプラクティスに関するガイダンスについては、安定した拡散3ドキュメントを参照してください。未解決の問題や質問がある場合は、サポートチームまたはコミュニティフォーラムに連絡してください。 結論
安定した拡散3は、一連のテキストから画像への生成AIモデルです。この記事では、Google ColabとComfyuiでAPIを使用し始める実用的な手順について説明しました。これで、独自の画像を作成するスキルがあります。忘れないように、できるだけ早く学んだことを必ず適用してください。お読みいただきありがとうございます!
さらなる学習安定した拡散Web UI:初心者向けの包括的なユーザーガイド
以上が安定した拡散3 APIの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。