ホームページ > テクノロジー周辺機器 > AI > 安定した拡散3 APIの使用方法

安定した拡散3 APIの使用方法

Joseph Gordon-Levitt
リリース: 2025-03-07 09:05:09
オリジナル
275 人が閲覧しました

安定性AIは、2024年2月に安定した拡散3の早期プレビューを発表しました。AIモデルはまだプレビュー中ですが、2024年4月に、チームは、Firworks AIと提携した後、安定性AI開発者プラットフォームAPIで安定したAI開発者プラットフォームで安定した拡散3と安定した拡散3ターボを利用できると発表しました。

安定した拡散3は、単に一連のテキストからイメージまでの生成AIモデルであることに注意してください。 Stability AIのチームによると、モデルは、OpenaiのDall-E 3やMidjourney V6などの他のテキストからイメージまでのジェネレーターを

「タイポグラフィと迅速なアドヒアランス」に "なぜ安定した拡散3?

安定した拡散3は、特にテキスト生成の改善と迅速な能力の観点から、テキストからイメージの生成スペースでそれを非常に競争力のあるものにするいくつかの進歩と機能を紹介します。

これらの進歩を探りましょう:

拡張プロンプト

  • コンテキストの理解:安定した拡散3には、最先端の自然言語処理(NLP)手法が組み込まれているため、ユーザープロンプトをよりよく理解して解釈できます。これにより、ユーザー入力に対するより正確でコンテキストに関連する応答が可能になります。
  • プロンプトの連続性:以前のバージョンとは異なり、Stable Diffusion 3は次のプロンプトでより良い連続性を維持し、生成されたテキストがコヒーレントのままであり、会話全体でユーザーの入力と整列していることを確認します。 テキスト生成の改善

微調整された言語モデル:
    安定した拡散3は、大規模なデータセットで広範なトレーニングを受けた微調整された言語モデルを利用して、テキスト生成機能が強化されます。これらのモデルは、文法、構文、およびセマンティクスをよりよく理解し、より首尾一貫した自然な反応につながります。
  • 応答の変動の減少:トレーニング方法とモデルアーキテクチャの改善により、安定した拡散3は応答の変動性を低下させ、さまざまなプロンプトとコンテキストでより一貫した高品質の出力を生成します。
  • 高度なプロンプト拡張
マルチターンダイアログサポート:

安定した拡散3は、マルチターンダイアログをより効果的に処理でき、ユーザーとAIモデル間の複数の交換にわたって一貫性とコンテキストを維持できます。

    迅速な拡張手法:
  • モデルは、高度な迅速な拡張技術を採用して、より有益で文脈的に関連する応答を生成し、対話を豊かにし、ユーザーにクエリに対する包括的な回答を提供します。 微調整された制御メカニズム
  • パラメーターチューニング:
  • 安定した拡散3には、ユーザーが応答長、創造性レベル、トピックの関連性などのパラメーターを調整できるように、よりカスタマイズされたインタラクションエクスペリエンスを可能にする微調整された制御メカニズムを備えています。

バイアス緩和:

モデルには、テキスト生成にバイアスを緩和し、ユーザープロンプトへの応答における公平性と包括性を促進するための手段を組み込んでいます。
  • 安定した拡散3 APIを開始します このセクションは、安定性APIから始めるための手順を実行します。
  • ステップ1:アカウントを作成します。 安定性AIのAPIを使用する前に、アカウントを作成する必要があります。ユーザー名とパスワードを使用してサインアップできますが、新しいユーザーはGoogleアカウントを使用してサインアップするための25の無料クレジットを取得します。
  • ステップ2:APIキーを請求します。
アカウントを作成したら、API GETが必要になります。これは、APIキーページにあります。ドキュメントでは、安定性AIは、「このサイトでドキュメントされたすべてのAPIが同じ認証メカニズムを使用していると述べています。APIキーを承認ヘッダーで渡します。」

ステップ3:クレジットのトッピング。 APIをリクエストするクレジットが必要です。クレジットは、APIを呼び出すときに消費される通貨単位です。消費される量は、モデルとモダリティによって異なります。すべてのクレジットを使い果たした後、請求ダッシュボードから100クレジットごとに1ドルでさらに購入できます。 このチュートリアルでは、Google ColabとComfyuiを使用して、安定した拡散3 APIを使用して画像を生成する方法を示します。次のセクションでは、各ツールの使用を開始する手順をカバーします。 Google Colabを使用して、安定した拡散3 APIを使用して

Google Colabを開始するには、Googleアカウントを作成する必要があります。リンクをクリックして指示に従ってください。

すでにGoogleアカウントをお持ちの場合は、新しいノートブックを開き、以下の手順に従ってください。

注:この例で使用されているコードは、安定性AIによってSD3_APIチュートリアルから取得されます。

ステップ1:要件をインストールします

ステップ2:安定性APIに接続します ステップ3。関数を定義します

ステップ4。画像を生成します
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ドキュメントによると、安定した画像サービスには、現在生産されている1つの提供のみが含まれています。

sd3:

は6.5クレジットを使用します
import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')
ログイン後にコピー
ログイン後にコピー

sd3ターボ:4クレジット

を使用します
def send_generation_request(
    host,
    params,
):
    headers = {
        "Accept": "image/*",
        "Authorization": f"Bearer {STABILITY_KEY}"
    }

    # Encode parameters
    files = {}
    image = params.pop("image", None)
    mask = params.pop("mask", None)
    if image is not None and image != '':
        files["image"] = open(image, 'rb')
    if mask is not None and mask != '':
        files["mask"] = open(mask, 'rb')
    if len(files)==0:
        files["none"] = ''

    # Send request
    print(f"Sending REST request to {host}...")
    response = requests.post(
        host,
        headers=headers,
        files=files,
        data=params
    )
    if not response.ok:
        raise Exception(f"HTTP {response.status_code}: {response.text}")

    return response
ログイン後にコピー

テストしましょう。 この例では、低地の熱帯地域にトゥーカンの鳥の画像を作成します。

これが作成されたものです:

  • 安定した拡散を使用して著者によって作成された画像3
  • さあ、SD3ターボを使用して果物で作られた車の画像を作成しましょう。 このコードを実行すると、次の画像が作成されました

# SD3

prompt = "This dreamlike digital art captures a vibrant, Toucan bird in a lowland tropic area" #@param {type:"string"}
negative_prompt = "" #@param {type:"string"}
aspect_ratio = "1:1" #@param ["21:9", "16:9", "3:2", "5:4", "1:1", "4:5", "2:3", "9:16", "9:21"]
seed = 0 #@param {type:"integer"}
output_format = "jpeg" #@param ["jpeg", "png"]

host = f"https://api.stability.ai/v2beta/stable-image/generate/sd3"

params = {
    "prompt" : prompt,
    "negative_prompt" : negative_prompt,
    "aspect_ratio" : aspect_ratio,
    "seed" : seed,
    "output_format" : output_format,
    "model" : "sd3",
    "mode" : "text-to-image"
}

response = send_generation_request(
    host,
    params
)

# Decode response
output_image = response.content
finish_reason = response.headers.get("finish-reason")
seed = response.headers.get("seed")

# Check for NSFW classification
if finish_reason == 'CONTENT_FILTERED':
    raise Warning("Generation failed NSFW classifier")

# Save and display result
generated = f"generated_{seed}.{output_format}"
with open(generated, "wb") as f:
    f.write(output_image)
print(f"Saved image {generated}")

output.no_vertical_scroll()
print("Result image:")
IPython.display.display(Image.open(generated))
ログイン後にコピー
安定した拡散を使用して著者によって作成された画像3ターボ

comfyui 安定した拡散3 APIの使用方法でAPIを使用します

comfyuiは、安定した拡散のための堅牢で柔軟なグラフィカルユーザーインターフェイス(GUI)です。グラフベースのインターフェイスを備えており、フローチャートスタイルのデザインを使用して、ユーザーが洗練された安定した拡散ワークフローを作成および実行できるようにします。

システム要件:

  • グラフィックスプロセシングユニット(GPU):RTX 3060 TI以上など、最低8GBのVRAMを備えた適切なNVIDIA GPU。
  • >>
  • 中央処理ユニット(CPU):Intel Xeon E5、I5、Ryzen 5などを含む現代プロセッサ。
  • ランダムアクセスメモリ(RAM):16GB以上。
  • オペレーティングシステム:Windows 10/11またはlinux。 モデルと生成された画像用のコンピューター上の適切なストレージスペース。
  • ステップ1:comfyui
  • をインストールします
WindowsにComfyuiをインストールするための最も簡単な方法には、リリースページにあるスタンドアロンインストーラーを使用することが含まれます。このインストーラーには、PytorchやHugging Face Transformersなどの重要な依存関係が含まれており、個別のインストールの必要性を排除します。

包括的なパッケージを提供し、複雑な構成を必要とせずにWindowsでcomfyuiの迅速なセットアップを可能にします。

単にダウンロード、抽出、モデルの追加、起動!

ステップ1.1:

このgithubリポジトリからcomfyuiのスタンドアロンバージョンをダウンロード - リンクをクリックすると、ダウンロードが開始されます。

ステップ1.2:

最新のcomfyui-windows.zipファイルをダウンロードしたら、7-zipやwinrarなどのユーティリティを使用して抽出します。 ステップ1.3:

Comfyuiの使用を開始するには、チェックポイントモデルが必要です。安定した拡散または抱きしめの顔からチェックポイントモデルをダウンロードできます。モデルをフォルダーに入れます:

ステップ1.4:

ここで、run_nvidia_gpu.bat(推奨)またはrun_cpu.batを実行するだけです。これにより、ブラウザでComfyuiを自動的に開始する必要があります コマンドラインは、ブラウザで開くことができるURL http://127.0.1:8188/を実行して生成します。 ステップ2:comfyuiマネージャー

をインストールします
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ファイルExplorerアプリケーション内で、インストールしたディレクトリを見つけます。 Windowsを使用していることを考えると、「comfyui_windows_portable」という名前にする必要があります。ここから、comfyuiに移動し、custom_nodesに移動します。この場所から、アドレスバーにCMDを入力し、Enterを押します。

これはコマンドプロンプト端末を開く必要があります。ここでは、次のコマンドを挿入する必要があります。 完了したら、Comfyuiを再起動します。新しい「

マネージャー

」ボタンがフローティングパネルに表示されます。

ステップ3:安定性AI APIノードをインストールします

[管理]ボタンを選択し、「

カスタムノードをインストールします。

」に移動して、「

stability api。

を検索します。
import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')
ログイン後にコピー
ログイン後にコピー
「comfyuiの安定性APIノード」ノードを見つけ、右側にあるインストールボタンをクリックしてインストールプロセスを開始します。これに続いて、「」ボタンが表示されます。 「restart」をクリックして、comfyuiを再起動します。

ステップ4:システム全体のAPIキーを定義します

このステップはオプションですが、お勧めします。つまり、安定性AIカスタムノード内の各ノードの安定性AI APIキーを設定できます。これにより、すべてのワークフローでAPIキーを繰り返し入力する必要がなくなり、ワークフローJSONファイルを共有するときにAPIキーを不注意に共有するリスクが低下します。

そうするために、カスタムノードディレクトリに移動します:

from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
sai_platform_key.txtという名前の新しいファイルを作成します。 APIキーをファイルに貼り付け、ドキュメントを保存してから、comfyuiを再起動します。

ステップ5:ワークフローをロードして実行します

安定した拡散3テキストから画像へのワークフローをインストールし、comfyuiにドロップします。

あなたは今行くのがいいです!

トラブルシューティングとヒント

他のツールと同様に、途中でいくつかの問題に遭遇する可能性が常にあります。 APIまたはセットアッププロセスの問題に直面しているユーザーのための最も一般的な課題とトラブルシューティング手順は次のとおりです。

APIキーと認証の問題

チャレンジ:

ユーザーは、APIキーまたは誤った認証資格情報のためにAPIにアクセスするときに認証エラーに直面する可能性があります。

トラブルシューティング:APIキーをダブルチェックし、コピーして正しく貼り付けていることを確認します。キーに余分なスペースや文字がないことを確認してください。 Stable Diffusion 3サーバーによってAPIキーが適切に認証されていることを確認してください。 クレジット管理の問題

チャレンジ:ユーザーは、クレジットの不十分なクレジットや請求エラーなど、クレジット管理に関連する問題に遭遇する可能性があります。

トラブルシューティング:

安定した拡散3ダッシュボードのクレジット残高を確認して、十分なクレジットを確保してください。請求情報を確認し、サポートチームとの請求エラーまたは不一致に対応します。

接続性とネットワークの問題

チャレンジ:

ユーザーは、APIにアクセスできないように接続性の問題またはネットワーク中断を経験する場合があります。 トラブルシューティング:

安定したインターネット接続があり、ネットワークの中断がないことを確認してください。問題を分離するには、別のネットワークまたはデバイスからAPIにアクセスしてみてください。接続性の問題を引き続き経験している場合は、インターネットサービスプロバイダーにお問い合わせください。

互換性と依存関係エラー

チャレンジ:

ユーザーは、必要なツールとライブラリをインストールまたは使用する際に、互換性の問題や依存関係エラーに遭遇する場合があります。

トラブルシューティング:安定した拡散3 APIの互換性要件を確認し、互換性のあるバージョンのツールとライブラリを使用していることを確認してください。エラーを引き起こしている依存関係を更新または再インストールします。トラブルシューティングガイダンスについては、ドキュメントとコミュニティフォーラムを参照してください。

パフォーマンスと応答時間

チャレンジ:ユーザーは、特にピーク使用時間中にAPIと対話するときに、応答時間やパフォーマンスの問題が遅い場合があります。

トラブルシューティング: APIのパフォーマンスと追跡回答時間を監視して、パターンまたはトレンドを特定します。パフォーマンスと優先度の高いアクセスを改善するために、より高い層のサブスクリプション計画にアップグレードすることを検討してください。一貫して遅い応答時間がある場合は、サポートチームに連絡してください。

ドキュメントとサポート

チャレンジ:ユーザーは、APIドキュメントを理解するのが難しい場合や、特定の問題のトラブルシューティングの支援が必要な場合があります。

トラブルシューティング:

APIの使用、トラブルシューティング、ベストプラクティスに関するガイダンスについては、安定した拡散3ドキュメントを参照してください。未解決の問題や質問がある場合は、サポートチームまたはコミュニティフォーラムに連絡してください。 結論

安定した拡散3は、一連のテキストから画像への生成AIモデルです。この記事では、Google ColabとComfyuiでAPIを使用し始める実用的な手順について説明しました。これで、独自の画像を作成するスキルがあります。忘れないように、できるだけ早く学んだことを必ず適用してください。

お読みいただきありがとうございます!

さらなる学習

安定した拡散Web UI:初心者向けの包括的なユーザーガイド

ドリームブースとロラを使用した安定した拡散XLを微調整します

安定した拡散を実行する方法
  • PythonのDiffusersを使用したAIを使用して、フォトリアリックな画像を生成
  • faqs
  • 安定した拡散3 APIを効果的に使用するためのベストプラクティスは何ですか?

安定した拡散を使用するためのベストプラクティス3 APIには、明確かつ特定のプロンプトの提供、異なるパラメーターの実験、希望の結果を達成するためのクレジット使用量の監視、枯渇を避けるための監視、最新のドキュメントと機能の最新情報を維持することが含まれます。 安定した拡散3とは何ですか?

安定した拡散は、テキストプロンプトから画像を生成することに焦点を当てたAIモデルのコレクションで構成されています。ユーザーは目的の画像の説明を提供し、モデルはこれらのプロンプトに基づいて対応する視覚表現を生成します。

安定した拡散はどのように機能するのか?このイノベーションは、GPTなどの大規模な言語モデルで一般的に使用される変圧器アーキテクチャを拡散モデルで統合し、両方のアーキテクチャの強みを活用する可能性を提供します。

以上が安定した拡散3 APIの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート