Dieses Python -Skript verwendet die Bibliothek der umarmenden Gesichtsdiffusoren, um Variationen eines Eingabebildes unter Verwendung stabiler Diffusion v1.5 zu erzeugen. Es ist ein leistungsstarkes Tool für die Bildmanipulation, mit der Benutzer Bilder basierend auf Textaufforderungen transformieren können.
Das Skript beginnt mit der Definition einer load_image
-Funktion. Diese Funktion behandelt sowohl lokale Bildwege als auch URLs und stellt die Kompatibilität mit verschiedenen Eingabehörungen sicher. Es konvertiert Bilder in RGB, ändert sie und verändert sie gleichzeitig das Seitenverhältnis und padelt sie auf eine konsistente 768x768 -Größe für die Verarbeitung durch das stabile Diffusionsmodell.
Die Kernfunktionalität liegt in generate_image_variation
. Diese Funktion initialisiert die stabile Diffusions -IMG2IMG -Pipeline, gibt die Modell -ID, das Gerät (CUDA, falls verfügbar, ansonsten CPU) und Datentyp für eine optimale Leistung an. Anschließend lädt es das vorverarbeitete Eingabebild und generiert die Pipeline, um Bildvariationen basierend auf der bereitgestellten Textaufforderung zu generieren. Schlüsselparameter z. Die Funktion ermöglicht auch ein zufälliges Saatgut für die Reproduzierbarkeit. strength
guidance_scale
Schließlich speichert
. save_generated_images
images-out
Die Beispielnutzung zeigt, wie das Skript verwendet wird. Es legt einen Eingabebildpfad (oder eine URL), eine Textaufforderung ("Zeichnen Sie das Bild in modernen Kunststilen, fotorealistisch und detailliert") und andere Parameter fest. Anschließend ruft es
. generate_image_variation
save_generated_images
strength
guidance_scale
seed
Das vorgesehene Beispiel verwandelt ein Bild mithilfe einer bestimmten künstlerischen Stilaufforderung. Die Vorher-Nachher-Bilder veranschaulichen die Fähigkeit des Skripts, den Stil und Erscheinungsbild eines Bildes basierend auf einer Textbeschreibung zu ändern. Die Ergebnisse zeigen visuell die Wirksamkeit des stabilen Diffusionsmodells und die Fähigkeit des Skripts, es für die Bildmanipulation zu integrieren.
Das obige ist der detaillierte Inhalt vonEntsperren Sie die AI-betriebene Bildverarbeitung auf Ihrem Laptop mit stabiler Diffusion V-es ist einfacher als Sie denken!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!