黑森林实验室的通量:深入研究尖端的文本对象一代
> 黑森林实验室> Flux是一个文本到图像生成模型的家族,擅长于从文本描述中产生高度详细和多样化的图像。
>关键功能将通量设置为分开:
>
Flux schnell:
最快的模型,旨在本地开发和个人使用。在Apache 2.0许可证下公开可用,可在拥抱脸上访问。 对于想要在本地进行实验而没有大量计算资源的用户的理想选择。> 磁通量的工作方式:通过流匹配
创新通量模型利用混合体系结构结合了多模式和平行扩散变压器块,缩放到120亿个参数。 即使有复杂的场景和样式,该体系结构也可以准确而多样化的图像生成。
进一步的性能增强功能来自:
flux dev(指南延伸):
import torch from diffusers import FluxPipeline pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-schnell", torch_dtype=torch.bfloat16) pipe.enable_model_cpu_offload() prompt = "A cat holding a sign that says hello world" out = pipe( prompt=prompt, guidance_scale=0.0, height=768, width=1360, num_inference_steps=4, max_sequence_length=256, ).images[0] out.save("image.png")
注意:FP16精度可用于更快地推断兼容GPU,但与FP32或BF16相比,结果可能会产生略有不同的结果。 强迫文本编码器在fp32中运行可以减轻这种情况。 现实世界应用
import torch from diffusers import FluxPipeline pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16) pipe.enable_model_cpu_offload() prompt = "a tiny astronaut hatching from an egg on the moon" out = pipe( prompt=prompt, guidance_scale=3.5, height=768, width=1360, num_inference_steps=50, ).images[0] out.save("image.png")
挑战和注意事项
虽然强大,但Flux提出了一些挑战:
通量代表了生成AI的重大进步,在众多应用程序中提供了强大的文本对图像功能。它的高图像质量,准确的提示和效率使其成为图像生成任务的引人注目的选择。 请记住使用通量时的性能优化和道德考虑。
>
以上是通量AI图像生成器:带有示例的指南的详细内容。更多信息请关注PHP中文网其他相关文章!