Seit der Veröffentlichung von Midjourney v5 wurden erhebliche Fortschritte beim Realismus von Charakteren und Fingerdetails in generierten Bildern sowie bei der Genauigkeit des sofortigen Verständnisses, der ästhetischen Vielfalt und dem Sprachverständnis erzielt .
Obwohl Stable Diffusion kostenlos und Open Source ist, muss es jedes Mal eine lange Liste von Eingabeaufforderungen schreiben, um qualitativ hochwertige Bilder zu generieren viele Ziehe einmal eine Karte.
Kürzlich gab Stability AI offiziell bekannt, dass die in der Entwicklung befindliche Stable Diffusion XL mit dem Test für die Öffentlichkeit begonnen hat und sich derzeit befindet Verfügbar auf Clipdrop. Die Plattform kann kostenlos ausprobiert werden.
Testlink: https://clipdrop.co/stable-diffusion#🎜 🎜 #
Emad Mostaque, Gründer und CEO von Stability AI, sagte, dass sich das Modell noch in der Trainingsphase befindet und Open Source sein wird, wenn die Parameter stabil sind schneidet bei Bilddetails wie „Handshake“ besser ab und ist nahezu vollständig kontrollierbar.
Stable Diffusion XL ist nicht der Name der endgültigen Version, und es ist nicht v3, weil SD-XL Die Architektur ist der Modellarchitektur der SD-v2-Serie sehr ähnlich. Minimalistisches Heim-Fitnessstudio mit Gummiboden, wandmontiertem Fernseher, Hantelbank, Medizinball, Hanteln, Yogamatten, High-Tech-Geräten, sehr detailliert, organisiert und effizient.
#🎜🎜 #Einfaches Heim-Fitnessstudio, Gummiboden, an der Wand hängender Fernseher, Hantelbank, Medizinball, Hanteln, Yogamatte, High-Tech-Ausrüstung, hohe Details, Organisation und Effizienz. Aus den offiziell veröffentlichten Beispielbildern Man erkennt, dass die Bildqualität bereits sehr beeindruckend ist.
# 🎜 🎜#
Aber manchmal bedeutet weniger nicht mehr. Einige Internetnutzer denken, dass SD -XL-Design Es wurden zu viele Regeln festgelegt und der Raum für Anpassungen wird immer kleiner, was nicht den Vorlieben der meisten Menschen entspricht. Stable Diffusion, derzeit Version 1.5, ist immer noch das beliebteste Basismodell in der Community.
Internetnutzer äußerten die Hoffnung, dass die neue Version von SD mit den Embedded-, Hypernetworkds- und Lora-Modellen kompatibel bleiben kann die SD 2.1-Version, und dann von Es wäre zu unangenehm für Zero, wieder mit dem Training zu beginnen.
Einige Internetnutzer glauben auch, dass die Leistung von SD-XL anders ist als die der Netizens der Civit-Website Die geteilten Modelle sind ähnlich, und die Wirkung des neuen Modells ist nicht besonders erstaunlich, was durchschnittlich ist.
Spezifisch für die Stable Diffusion XL Modell Der Beamte gab nicht viele Informationen bekannt. Derzeit wissen sie nur, dass es sich um ein Modell mit einer ähnlichen Architektur wie das v2-Modell handelt, jedoch mit einem größeren Maßstab und einer größeren Parameteranzahl.
SD-v2.1 enthält 900 Millionen Parameter, SD-XL hat etwa 2,3 Milliarden Parameter und Emad sagte, dass die offizielle Version möglicherweise zusätzlich eine kleinere destillierte Version veröffentlichen wird.
Die Verbesserungen von SD-XL im Vergleich zur Vorgängerversion sind wie folgt:
Ein Mann festgehalten ein Schild mit der Aufschrift „Stabile Diffusion“
Eine junge Frau hält ein Schild mit der Aufschrift „Stabile Diffusion“ in der Hand, Highlights im Haar, sitzend vor dem Restaurant, braune Augen, trägt ein Kleid, Seitenlicht
Eine junge Frau hält ein Schild mit der Aufschrift „Stable Diffusion“ in der Hand gesträhntes Haar, vor dem Restaurant sitzend, braune Augen, trägt einen Rock, seitwärts gerichtete Lampe
Better Human Structure#🎜 🎜#Stabile Diffusion bei der Generierung der menschlichen Anatomie. Es gab immer viele Probleme. Überschüssige Beine und weniger Arme sind in der Regel notwendig, um die Bilddetails weiter zu korrigieren Pose-Funktion zum Kopieren der Haltung des menschlichen Körpers aus dem Referenzbild.
Wenn beispielsweise SD-v1.5 Yoga-Bilder generiert, erscheinen häufig verzerrte menschliche Körper.
Foto einer Frau im Yoga-Outfit, Dreieckspose, Strand am Abend, Randbeleuchtung# 🎜🎜#
Foto einer Frau im Yoga-Outfit, Dreieckspose, Strand bei Nacht, Kantenbeleuchtung # 🎜 🎜# Obwohl die von SD-XL erzeugten Bilder nicht perfekt sind, haben sie erhebliche Fortschritte in der menschlichen Körperhaltung gemacht. Mit dem gleichen Thema eines Hauses kann SD-XL beispielsweise Fotos erzeugen, die symmetrischer sind und bessere visuelle Effekte haben. SD-XL bietet auch deutliche Verbesserungen bei Porträtfotos. Fotoaufnahme einer Frau Ein Bild, das besser zur Eingabeaufforderung passt Am Beispiel von Duotone (zweifarbig) erzeugt SD-v1.5 nur Schwarzweißbilder, während SD-XL Dualtone-Bilder mit mehreren Farben erzeugen kann. Die Fähigkeit, Eingabeaufforderungen zu verstehen, hat sich im Vergleich zum v1-Modell verbessert. „Duotone-Porträt einer Frau“ im Vergleich zum v1-Modell Besseres Verständnis von Aufforderungswörtern. Im Beispiel unten kann das Modell v1.5 beispielsweise nie die beiden Motive im Bild (Roboter und Mensch) verstehen, aber das SD-XL-Modell kann normale Bilder erzeugen (obwohl der Roboter dies tut). immer noch nicht groß genug).
großer Roboterfreund sitzt neben einem Menschen, Geist im Muschelstil, Anime-Hintergrundbild Großer Roboterfreund sitzt neben einem Menschen, Geist im Muschelstil, Anime-Hintergrundbild ein junger Mann, Strähnchen im Haar, braune Augen, in weißem Hemd und blauer Jeans an einem Strand mit einem Vulkan im Hintergrund Kunststil In Bezug auf den Kunststil SD-XL hat sich nicht wesentlich verbessert und weist eigene Unterschiede zur Vorgängerversion auf. Zum Beispiel erzeugen zwei Modelle Bilder im Edward Hopper-Stil aus verschiedenen Blickwinkeln. New York City von Edward Hopper Edward Hoppers New York Leonid Afmovs Stil, SD-v1.5 ist genauer, SD-XL fehlen Pinsel in verschiedenen Farben (unverwechselbare bunte Pinselstriche auf der Tafel).
New York City von Leonid Afemov New York von Leonid Afemov Etwas Ähnliches lässt sich herstellen, mit Das SD-XL ähnelt eher den klassischen akademischen Gemälden von Bouguereau und weist mehr Gesichtsdetails auf. Porträt einer schönen Frau von William-Adolphe Bouguereau # ?? Nach dem Hinzufügen einiger irrelevanter Schlüsselwörter kann sich der Stil des Modells plötzlich ändern. Generieren Sie beispielsweise zunächst ein Bild im Fotostil. Ein junger Mann, Strähnchen im Haar, braune Augen, in weißem Hemd und blauer Jeans an einem Strand mit einem Vulkan im Hintergrund A junger Mann mit bunt gefärbten Haaren und braunen Augen, trägt ein weißes Hemd und blaue Jeans, steht am Strand, mit einem Vulkan im Hintergrund Nach dem Hinzufügen ein gelber Schal, der Bildstil wird zum Cartoon-Stil. in weißem Hemd und blauer Jeans an einem Strand mit einem Vulkan im Hintergrund Ein junger Mann mit gefärbten Haaren Sehr helle, braune Augen, trägt einen gelben Schal, trägt ein weißes Hemd und blaue Jeans, steht an einem Strand mit einem Vulkan als Hintergrund Ästhetischer
SD-XL kann die Eingabeaufforderung besser verstehen und genauere Bilder erzeugen.
ein junger Mann, Strähnchen im Haar, braune Augen,
trägt ein Gelb Schal,
Das obige ist der detaillierte Inhalt vonStable Diffusion-XL ist für die öffentliche Beta geöffnet und erspart Ihnen lange und umständliche Eingabeaufforderungen!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!