首頁 > 科技週邊 > 人工智慧 > 如何使用穩定的擴散3 API

如何使用穩定的擴散3 API

Joseph Gordon-Levitt
發布: 2025-03-07 09:05:09
原創
280 人瀏覽過

>穩定性AI宣布了2024年2月的穩定擴散3的早期預覽。 AI模型仍在預覽中,但是在2024年4月,該團隊宣布,他們將在與Faster -Fast -fast Pastiale and fastect and faste faste Plaste Carket in and穩定的AI開發人員平台上提供穩定的擴散3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪增壓3渦輪。

請注意,穩定擴散3只是一系列文本到圖像生成的AI模型。根據穩定性AI的團隊的說法,該模型為“等於或跑得超越或跑得超越或跑得超越或跑步”。

在本教程中,您將學習實用的步驟以開始使用API​​,因此您可以開始生成自己的圖像。 為什麼穩定擴散3? > 穩定的擴散3引入了幾種進步和功能,使其與前任區分開來,並在文本到圖像生成空間中具有很高的競爭力,尤其是在改進的文本生成和迅速跟踪功能方面。 讓我們探索這些進步:

>增強提示

  • 上下文理解:穩定的擴散3結合了最先進的自然語言處理(NLP)技術,從而使其能夠更好地理解並解釋用戶提示。這使得對用戶輸入的更準確和上下文相關的響應。
  • >
  • 提示連續性:與以前的版本不同,穩定擴散3在以下提示中保持了更好的連續性,確保生成的文本保持一致並與用戶在整個對話中的輸入保持一致。
  • >

改進的文本生成

  • 微調語言模型:
  • 穩定的擴散3利用了對大型數據集進行了廣泛培訓的微調語言模型,從而增強了文本生成功能。這些模型可以更好地了解語法,語法和語義,從而產生更連貫和自然的響應。
  • 降低響應變異性:通過改進的訓練方法和模型架構,穩定的擴散3可降低響應變異性,在不同的提示和上下文中產生更一致和高質量的輸出。
高級提示擴展

  • 多轉向對話支持:穩定的擴散3可以更有效地處理多轉化對話,從而在用戶與AI模型之間進行多個交流之間保持連貫性和上下文。 提示擴展技術:
  • 該模型採用高級提示擴展技術來產生更有信息和上下文相關的響應,豐富了對話,並為用戶提供了對其查詢的全面答案。
  • 微調控制機制

參數調整:

穩定的擴散3具有微調控制機制,使用戶可以調整參數,例如響應長度,創造力級別和主題相關性,從而啟用更自定義的交互體驗。
  • 偏差緩解:該模型結合了減輕文本生成偏見的措施,在其對用戶提示的響應中促進公平性和包容性。
  • 開始使用穩定擴散3 API 本節將通過穩定性API開始的步驟。
  • >
步驟1:創建您的帳戶。

>您需要創建一個帳戶,然後才能使用穩定性AI的API。您可以使用用戶名和密碼註冊,但是新用戶使用他們的Google帳戶獲得25個免費積分。

>

步驟2:要求您的API鍵。

創建帳戶後,您將需要一個API。這可以在API鍵頁面上找到。在文檔中,穩定性AI指出“本網站上記錄的所有API都使用相同的身份驗證機制:通過授權標頭傳遞API鍵。

步驟3:充滿信心。 >您必須有學分才能請求API。信用是在調用API時消耗的貨幣單位 - 各種模型和模式的消耗量各不相同。使用所有積分後,您可以通過計費儀表板以每100個積分$ 1美元的價格購買更多。

> 在本教程中,我們將使用Google Colab和comfyui來演示如何使用穩定的擴散3 API生成圖像。在下一部分中,我們將介紹使用每個工具開始使用的步驟。

>

使用Google Colab

使用穩定的擴散3 API

要開始使用Google Colab,您必須創建一個Google帳戶 - 單擊鏈接並按照說明。

如果您已經有了Google帳戶,請打開新筆記本並按照以下步驟操作。

>

注意:此示例中使用的代碼是從穩定性AI的SD3_API教程中獲取的 步驟1:安裝要求。

>

>步驟2:連接到穩定性API。

from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
登入後複製
登入後複製
登入後複製

步驟3。定義函數

import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')
登入後複製

步驟4。生成圖像。 >

根據文檔,穩定的圖像服務僅包括目前正在生產的產品:>
def send_generation_request(
    host,
    params,
):
    headers = {
        "Accept": "image/*",
        "Authorization": f"Bearer {STABILITY_KEY}"
    }

    # Encode parameters
    files = {}
    image = params.pop("image", None)
    mask = params.pop("mask", None)
    if image is not None and image != '':
        files["image"] = open(image, 'rb')
    if mask is not None and mask != '':
        files["mask"] = open(mask, 'rb')
    if len(files)==0:
        files["none"] = ''

    # Send request
    print(f"Sending REST request to {host}...")
    response = requests.post(
        host,
        headers=headers,
        files=files,
        data=params
    )
    if not response.ok:
        raise Exception(f"HTTP {response.status_code}: {response.text}")

    return response
登入後複製

> sd3:>使用6.5 Credits

SD3 Turbo:

使用4個學分
  • 讓我們測試它們。
  • 在此示例中,我們將在低地熱帶地區創建一隻Toucan鳥的圖像。
  • 這是它創建的:

作者使用穩定擴散3

# SD3

prompt = "This dreamlike digital art captures a vibrant, Toucan bird in a lowland tropic area" #@param {type:"string"}
negative_prompt = "" #@param {type:"string"}
aspect_ratio = "1:1" #@param ["21:9", "16:9", "3:2", "5:4", "1:1", "4:5", "2:3", "9:16", "9:21"]
seed = 0 #@param {type:"integer"}
output_format = "jpeg" #@param ["jpeg", "png"]

host = f"https://api.stability.ai/v2beta/stable-image/generate/sd3"

params = {
    "prompt" : prompt,
    "negative_prompt" : negative_prompt,
    "aspect_ratio" : aspect_ratio,
    "seed" : seed,
    "output_format" : output_format,
    "model" : "sd3",
    "mode" : "text-to-image"
}

response = send_generation_request(
    host,
    params
)

# Decode response
output_image = response.content
finish_reason = response.headers.get("finish-reason")
seed = response.headers.get("seed")

# Check for NSFW classification
if finish_reason == 'CONTENT_FILTERED':
    raise Warning("Generation failed NSFW classifier")

# Save and display result
generated = f"generated_{seed}.{output_format}"
with open(generated, "wb") as f:
    f.write(output_image)
print(f"Saved image {generated}")

output.no_vertical_scroll()
print("Result image:")
IPython.display.display(Image.open(generated))
登入後複製
創建的圖像

現在,讓我們使用SD3 Turbo創建由水果製成的汽車的圖像:

如何使用穩定的擴散3 API運行此代碼產生以下圖像:>

作者使用穩定擴散3渦輪

使用comfyui

的API comfyui是用於穩定擴散的強大且靈活的圖形用戶界面(GUI)。它具有基於圖的接口,並使用流程圖式設計來使用戶能夠創建和運行複雜的,穩定的擴散工作流程。

系統要求:

  • 圖形處理單元(GPU):>具有至少8GB VRAM的足夠的NVIDIA GPU,例如RTX 3060 TI或更高。
  • 中央處理單元(CPU): 隨機訪問存儲器(RAM):
  • 16GB或更大。
  • 操作系統:
  • Windows 10/11或Linux。
  • >計算機上的足夠存儲空間用於型號和生成的圖像。 >步驟1:安裝comfyui >在Windows上安裝Comfyui的最簡單方法涉及使用版本頁面上的獨立安裝程序。該安裝程序包括諸如Pytorch和擁抱臉部變壓器之類的基本依賴項,從而消除了對單獨安裝的需求。 它提供了一個綜合的軟件包,可以在Windows上快速設置Comfyui,而無需複雜的配置。
  • >
  • 只需下載,提取,添加模型並啟動!
>

步驟1.1:

>從此github存儲庫中下載comfyui的獨立版本 - 單擊鏈接將啟動下載。 >

>

步驟1.2:

>您下載了最新的comfyui-windows.zip文件後,請使用諸如7-zip或winrar等實用程序提取它。

>

步驟1.3:開始使用comfyui需要一個檢查點模型。您可以從穩定擴散或擁抱面下載檢查點模型。將模型放入文件夾中:

>步驟1.4:現在,只需運行run_nvidia_gpu.bat(推薦)或run_cpu.bat即可。這應該在瀏覽器上自動啟動comfyui。 >

命令行將執行並生成URL http://127.0.0.0.1:8188/您現在可以在瀏覽器中打開。

> >步驟2:安裝Comfyui Manager 在文件資源管理器應用程序中,找到您剛安裝的目錄。鑑於您使用的是Windows,應將其命名為“ comfyui_windows_portable”。從這裡導航到comfyui,然後從這裡導航。在此位置,在地址欄中鍵入CMD,然後按Enter。

這應該打開命令提示符終端,您必須在其中插入以下命令:>
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
登入後複製
登入後複製
登入後複製

完成後,重新啟動comfyui。新的“管理器”按鈕應顯示在浮動面板上。

步驟3:安裝穩定性AI API節點

選擇“管理”按鈕並導航到“

> install stern custom節點”。

>找到“ comfyui的穩定性API節點”節點,然後單擊位於右側的安裝按鈕以啟動安裝過程。之後,將看到一個“

重新啟動”按鈕。單擊重新啟動comfyui。

步驟4:定義系統範圍的API鍵

此步驟是可選的,但建議使用。即,您可以為穩定性AI自定義節點中的每個節點設置穩定性AI API鍵。這防止了需要在每個工作流程中反复輸入API密鑰,並降低了共享工作流JSON文件時無意性共享API密鑰的風險。

> 為此,請導航到自定義節點目錄:

>創建一個名為sai_platform_key.txt的新文件。將您的API鍵粘貼到文件中,保存文檔,然後重新啟動Comfyui。
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
登入後複製
登入後複製
登入後複製
>步驟5:加載並運行工作流

>安裝穩定的擴散3文本對圖像工作流,然後將其放入comfyui。

您現在很好!

>

>故障排除和提示

與任何工具一樣,總是有可能在此過程中遇到一些問題。這是針對API或設置過程面臨問題的用戶的最常見挑戰和故障排除步驟。

>

> API密鑰和身份驗證問題

挑戰:

>由於不正確的API鍵或錯誤的身份驗證,用戶在訪問API時可能會遇到身份驗證錯誤。

>

>>故障排除:>雙檢查API鍵,並確保它被正確複製和粘貼。驗證鑰匙中沒有其他空間或字符。確保通過穩定的擴散3服務器對API密鑰正確身份驗證。

信用管理問題

> 挑戰:

>用戶可能會遇到與信用管理有關的問題,例如信用管理不足或計費錯誤。

>

>故障排除:>在穩定的擴散3儀表板中檢查您的信用餘額,以確保您擁有足夠的信用。驗證您的計費信息,並解決與支持團隊的任何計費錯誤或差異。

連接和網絡問題

> 挑戰:

>用戶可能會遇到連接問題或網絡中斷,以阻止他們訪問API。

>

>故障排除:

確保您具有穩定的Internet連接,並且沒有網絡中斷。要隔離問題,請嘗試從其他網絡或設備訪問API。如果您繼續遇到連接問題,請與您的互聯網服務提供商聯繫。 兼容性和依賴性錯誤

>挑戰:用戶在安裝或使用所需的工具和庫時可能會遇到兼容性問題或依賴性錯誤。 >

故障排除:

檢查穩定擴散3 API的兼容性要求,並確保您使用兼容的工具和庫的版本。更新或重新安裝任何引起錯誤的依賴項。請參閱文檔和社區論壇以進行故障排除指導。

>性能和響應時間

>挑戰:>用戶在與API互動時,尤其是在使用高峰時段時可能會遇到緩慢的響應時間或性能問題。

>

>故障排除:>監視API的性能和跟踪響應時間以識別模式或趨勢。考慮升級到高級訂閱計劃,以提高性能和優先級訪問。如果您始終遇到緩慢的響應時間,請與支持團隊聯繫。

>

文檔和支持

> 挑戰:>用戶可能會遇到困難理解API文檔,或者需要對特定問題進行故障排除。

>

故障排除:有關API使用,故障排除和最佳實踐的指南,請參閱穩定的擴散3文檔。如果您有任何尚未解決的問題或問題,請聯繫支持團隊或社區論壇。

結論

>穩定的擴散3是一系列文本到圖像生成的AI模型。本文介紹了開始使用Google Colab和Comfyui使用API​​的實用步驟。現在,您擁有創建自己的圖像的技能;請確保盡快應用您學到的知識,以免忘記。

>

感謝您的閱讀!

進一步學習 >穩定的擴散Web UI:初學者的綜合用戶指南
    與Dreambooth和Lora
  • 的微調穩定擴散XL
  • 如何運行穩定的擴散
  • 使用與python中的擴散器的AI生成逼真的圖像
  • >
  • FAQS
  • >有效使用穩定擴散3 API的最佳實踐是什麼? 使用穩定的擴散3 API包括提供清晰而特定的提示,嘗試不同的參數以實現所需的結果,監視耗盡並保持最新文檔和功能。
什麼是穩定擴散3?

穩定的擴散包含集合的AI模型集合,這些模型致力於從文本提示中生成圖像。用戶提供了所需圖像的描述,該模型根據這些提示生成相應的視覺表示。

>穩定的擴散如何工作?

穩定的擴散3採用類似於Sora的擴散變壓器體系結構,與SORA類似於Sora,與使用AIS的擴散模型AIS的擴散模型不同。這項創新融合了在大型語言模型(例如GPT)與擴散模型中常用的變壓器體系結構,從而提供了利用這兩種體系結構的優勢的潛力。

以上是如何使用穩定的擴散3 API的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板