通量AI圖像生成器：帶有示例的指南-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

通量AI圖像生成器：帶有示例的指南

尊渡假赌尊渡假赌尊渡假赌

Mar 04, 2025 am 09:02 AM

黑森林實驗室的通量：深入研究尖端的文本對像一代

> 黑森林實驗室在具有其通量模型套件的生成AI中取得了顯著的進步。這些模型是文本到圖像綜合的領導者，以其出色的視覺質量，準確的及時解釋和風格多功能性而聞名。該博客文章詳細介紹了我在通量方面的經驗，為初學者提供了全面的指南。我們將介紹關鍵功能，功能，管道設置，應用程序等。

> Flux是一個文本到圖像生成模型的家族，擅長於從文本描述中產生高度詳細和多樣化的圖像。

>關鍵功能將通量設置為分開：

> >精確提示依從性：模型準確地反映了用戶的輸入，確保生成的圖像與提示密切匹配。

>廣泛的風格和場景多樣性：>

優化的效率：高級技術，例如旋轉位置嵌入和平行注意層，可以增強性能。

磁通模型家族：pro，dev和schnell

通量系列包括三個變體，每個變體都針對特定需求進行量身定制：> >flux Pro：旗艦模型，為要求高質量圖像生成的專業應用提供了頂級性能。可通過黑森林實驗室的API，重複和FAL.AI訪問

flux dev：非商業用途的開放權重指導模型。提供類似的質量和迅速遵守Flux Pro，但效率提高。可在擁抱臉，重複和Fal.ai上使用。非常適合開發人員，研究人員和業餘愛好者。

Flux schnell：

最快的模型，旨在本地開發和個人使用。在Apache 2.0許可證下公開可用，可在擁抱臉上訪問。對於想要在本地進行實驗而沒有大量計算資源的用戶的理想選擇。 > 磁通量的工作方式：通過流匹配

創新

通量模型利用混合體系結構結合了多模式和平行擴散變壓器塊，縮放到120億個參數。即使有復雜的場景和样式，該體系結構也可以準確而多樣化的圖像生成。 > 核心創新是流量匹配

。與傳統的擴散模型不同，迭代的嘈雜圖像（流匹配的流程）直接引導生成過程，類似於準確追踪圖形。這種方法顯著提高了速度和圖像保真度。

進一步的性能增強功能來自：

>>旋轉位置嵌入：提供了對圖像中空間關係的詳細理解，對於生成複雜的視覺效果至關重要。
同時處理不同的圖像部分，提高計算效率。

開始使用Flux：逐步指南

Flux AI Image Generator: A Guide With Examples

>選擇您的變體：

> >訪問模型：
通過測試各種提示，從簡單的圖像到復雜的場景， >進行提示：探索模型的功能。
優化性能：採用模型量化，內存有效管道和推理優化等技術，以提高效率，尤其是在資源受限的系統上。
通量模型可提供兩個蒸餾變量：timeStep-distled（通量schnell）和指導驅動（Flux Dev）。

通過更少的採樣步驟將速度確定優先級。局限性包括最大序列長度為256個令牌和0。固定引導量表。

flux dev（指南延伸）：優先級以上質量優先於速度，需要大約50個採樣步驟。沒有序列長度的限制。

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-schnell", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload()
prompt = "A cat holding a sign that says hello world"
out = pipe(
    prompt=prompt,
    guidance_scale=0.0,
    height=768,
    width=1360,
    num_inference_steps=4,
    max_sequence_length=256,
).images[0]
out.save("image.png")

登入後複製

Flux AI Image Generator: A Guide With Examples

注意：FP16精度可用於更快地推斷兼容GPU，但與FP32或BF16相比，結果可能會產生略有不同的結果。強迫文本編碼器在fp32中運行可以減輕這種情況。現實世界應用

import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload()
prompt = "a tiny astronaut hatching from an egg on the moon"
out = pipe(
    prompt=prompt,
    guidance_scale=3.5,
    height=768,
    width=1360,
    num_inference_steps=50,
).images[0]
out.save("image.png")

登入後複製

通量在各個領域找到應用：