Das schnellste Modell mit einer Auflösung von 1024, das offene ByteDance Vincent Graph-Modell SDXL-Lightning, wurde veröffentlicht-KI-php.cn

Inhaltsverzeichnis

1. Blitzschnelle Bildgenerierung

SDXL-Lightning

4. Zu technischen Details

Heim

Technologie-Peripheriegeräte

Das schnellste Modell mit einer Auflösung von 1024, das offene ByteDance Vincent Graph-Modell SDXL-Lightning, wurde veröffentlicht

PHPz

Feb 24, 2024 pm 12:37 PM

generative KI

Modell｜https://www.php.cn/link/36ef259d4d9967f3a81aa326160128c7

Papier｜https://www.php.cn/link/ca0525bfe5cab4c577 d169d3343a5452

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

1. Blitzschnelle Bildgenerierung

Generative KI gewinnt weltweite Aufmerksamkeit für ihre Fähigkeit, atemberaubende Bilder und sogar Videos basierend auf Textaufforderungen zu erstellen. Aktuelle generative Modelle auf dem neuesten Stand der Technik basieren auf Diffusion, einem iterativen Prozess, der Rauschen schrittweise in Bildbeispiele umwandelt. Dieser Prozess erfordert enorme Rechenressourcen und ist langsam. Bei der Generierung hochwertiger Bildbeispiele beträgt die Verarbeitungszeit eines einzelnen Bildes etwa 5 Sekunden, was normalerweise mehrere Aufrufe (20 bis 40 Mal) an das riesige neuronale Netzwerk erfordert. Netzwerk . Diese Geschwindigkeit schränkt Anwendungsszenarien ein, die eine schnelle Generierung in Echtzeit erfordern. Wie man die Erzeugungsqualität verbessern und gleichzeitig beschleunigen kann ist ein aktuelles Forschungsgebiet und das Kernziel unserer Arbeit.

SDXL-Lightning durchbricht diese Barriere durch eine innovative Technologie –

Progressive Adversarial Distillation – um beispiellose Erzeugungsgeschwindigkeiten zu erreichen. Das Modell ist in der Lage, Bilder von extrem hoher Qualität und Auflösung in nur 2 oder 4 Schritten zu erzeugen, wodurch der Rechenaufwand und die Rechenzeit um den Faktor zehn reduziert werden. Unsere Methode kann für zeitüberschreitungsempfindliche Anwendungen sogar Bilder in einem Schritt generieren, wenn auch mit geringfügigen Qualitätseinbußen.

SDXL-Lightning hat nicht nur einen Geschwindigkeitsvorteil, sondern zeichnet sich auch durch die Bildqualität aus und übertrifft bisherige Beschleunigungstechnologien in Bewertungen. Es ermöglicht eine höhere Auflösung und reichere Details bei gleichzeitig guter Diversität und Bild-Text-Übereinstimmung.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Geschwindigkeitsvergleich

Originalmodell (20 Schritte), SDXL-Lightning-Modell (2 Schritte)

2. Modelleffekt

SDXL-Lightning Das Modell kann bestehen 1 Schritt, 2 Schritte, 4 Schritte und 8 Schritte zum Generieren von Bildern. Je mehr Inferenzschritte vorhanden sind, desto besser ist die Bildqualität.

Das Folgende ist das Ergebnis von 4 Schritten –

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Ein lächelndes Mädchen

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Ein Pickup, der eine Bergkehre hinauffährt

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Ein Fisch auf einem Fahrrad, farbenfrohe Kunst. Eine Nahaufnahme einer asiatischen Dame mit Sonnenbrille. Eine wunderschöne Tasse. Mona Lisa, Skizze

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Ein Pickup, der eine Bergkehre hinauffährt

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Haus in der Wüste, surreale Landschaften

Das Folgende ist das Ergebnis von 2 Schritten –

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Möbeldesign für ein Wohnzimmer

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Eine filmische Aufnahme eines Babys. Waschbär tragen ein aufwendiges italienisches Priestergewand

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Ein Hund mit weichem Fell und leuchtenden Augen, der einem Spielzeug hinterherspringt, in einem gemütlichen Wohnzimmer

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Eine Teetasse mit Wolken

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Eine Familie, mittelgroße Aufnahme

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布 🎙 Im Vergleich zu den vorherigen Methoden (Turbo und LCM) sind die mit unserer Methode generierten Bilder deutlich detaillierter und entsprechen besser dem Stil und Layout des ursprünglichen generativen Modells.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

3. Geben Sie der Community etwas zurück, offenes Modell

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布 Die Welle von Open Source und Open Source ist zu einer Schlüsselkraft bei der Förderung der schnellen Entwicklung künstlicher Intelligenz geworden, und Bytedance ist stolz darauf, ein Teil davon zu sein diese Welle. Unser Modell basiert auf SDXL, dem derzeit beliebtesten offenen Modell für die Textgenerierung von Bildern, das bereits über ein florierendes Ökosystem verfügt. Jetzt haben wir beschlossen, SDXL-Lightning für Entwickler, Forscher und kreative Praktiker auf der ganzen Welt zu öffnen, damit sie auf dieses Modell zugreifen und es anwenden können, um Innovation und Zusammenarbeit in der gesamten Branche weiter voranzutreiben.

Beim Design von SDXL-Lightning haben wir die

Kompatibilität mit der Open-Model-Community

berücksichtigt. Viele Künstler und Entwickler in der Community haben eine Vielzahl stilisierter Bildgenerierungsmodelle erstellt, beispielsweise Cartoon- und Anime-Stile. Um diese Modelle zu unterstützen, bieten wir SDXL-Lightning als Beschleunigungs-Plug-in an, das nahtlos in diese verschiedenen Arten von SDXL-Modellen integriert werden kann, um die Bildgenerierung für verschiedene Modelle zu beschleunigen. 1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

SDXL-Lightning

Das Modell kann auch mit dem aktuell sehr beliebten Steuerungs-Plug-in ControlNet kombiniert werden, um eine extrem schnelle und kontrollierbare Bilderzeugung zu erreichen. 1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

SDXL-Lightning

Das Modell unterstützt auch ComfyUI, die beliebteste Generationssoftware in der Open-Source-Community. Das Modell kann direkt zur Verwendung geladen werden:

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

4. Zu technischen Details

Theoretisch ist die Bilderzeugung ein schrittweiser Transformationsprozess von Rauschen zu klaren Bildern. Dabei lernt das neuronale Netz die Gradienten an verschiedenen Positionen im Transformationsfluss.

Die spezifischen Schritte zum Generieren eines Bildes sind wie folgt:

Zuerst tasten wir zufällig eine Rauschprobe am Startpunkt des Streams ab und verwenden dann ein neuronales Netzwerk, um den Gradienten zu berechnen. Basierend auf dem Gradienten an der aktuellen Position nehmen wir kleine Anpassungen an der Probe vor und wiederholen dann den Vorgang. Mit jeder Iteration nähern sich die Proben der endgültigen Bildverteilung an, bis ein klares Bild entsteht.

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Bild: Generationsfluss Prozess (Bild von: https://www.php.cn/link/5c9b5c47258cf1499c2dc64b7072e735

Due zur Komplexität und Nichtlinearität des Generierungsflusses Gerade Linie, der Generierungsprozess muss einmalig sein. Machen Sie nur einen kleinen Schritt, um die Anhäufung von Gradientenfehlern zu reduzieren, sodass häufige Berechnungen des neuronalen Netzwerks erforderlich sind, weshalb der Berechnungsaufwand groß ist

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Bild: Kurvenprozess (Bild von: https://www.php.cn/link/d7bbb6396ce5daf19ec6cf4bb4453137

Um die Anzahl der Schritte zur Generierung von Bildern zu reduzieren, wurden viele Studien der Lösungsfindung gewidmet. Einige Studien haben Stichprobenmethoden vorgeschlagen, die den Fehler reduzieren können, während andere versucht haben, den Generierungsfluss linearer zu gestalten, sie erfordern jedoch immer noch mehr als 10 Inferenzschritte, um Bilder zu erzeugen. Dies ist in der Lage, qualitativ hochwertige Bilder in weniger als 10 Inferenzschritten zu erzeugen. Anders als bei der Berechnung des Gradienten unter der aktuellen Strömungsposition ändert die Modelldestillation das Ziel der Modellvorhersage, um die nächstweitere Strömungsposition direkt vorherzusagen Eine solche Strategie kann die Anzahl der erforderlichen Inferenzschritte erheblich reduzieren, indem wir die Anzahl der Inferenzschritte weiter reduzieren progressive Destillation.

Abbildung: Progressive Destillation, das Schülernetzwerk prognostiziert die Ergebnisse des Lehrernetzwerks nach mehreren Schritten

1024 分辨率下最快模型，字节跳动文生图开放模型 SDXL-Lightning 发布

Im tatsächlichen Betrieb ist es für das Schülernetzwerk oft schwierig, die zukünftige Strömungsposition genau vorherzusagen, was dazu führt, dass Mit der Akkumulation jedes Schritts verstärken sich die vom Modell erzeugten Bilder. Um dieses Problem zu lösen, besteht unsere Strategie nicht darin, das Schülernetzwerk dazu zu zwingen, die Vorhersagen genau abzugleichen des Lehrernetzwerks, sondern damit das Schülernetzwerk die Vorhersagen des Lehrernetzwerks wahrscheinlichkeitskonsistent mit dem Lehrernetzwerk abgleicht. Mit anderen Worten, das Schülernetzwerk wird darauf trainiert, eine wahrscheinlichkeitstheoretisch mögliche Position vorherzusagen, und wir bestrafen es nicht einmal Wenn diese Position nicht ganz korrekt ist, wird dieses Ziel durch kontradiktorisches Training erreicht. Ein zusätzliches diskriminierendes Netzwerk wird eingeführt, um eine Verteilungsanpassung der Ergebnisse des Schüler- und Lehrernetzwerks zu erreichen.

Dies ist ein kurzer Überblick über unsere Forschungsmethoden (

https:/ /www.php.cn/link/ca0525bfe5cab4c577d169d3343a5452). untersucht, wie die SDXL-Lightning-Technologie zur Bilderzeugung verwendet werden kann. Das Anwendungspotenzial unserer vorgeschlagenen progressiven kontradiktorischen Destillationsmethode ist jedoch nicht auf statische Bilder beschränkt. Diese innovative Technologie kann auch auf die schnelle und qualitativ hochwertige Erzeugung von Video-, Audio- und Videodaten angewendet werden andere multimodale Inhalte. Wir laden Sie herzlich ein, SDXL-Lightning auf der HuggingFace-Plattform zu erleben und freuen uns auf Ihre wertvollen Kommentare und Rückmeldungen.

Modell:

https://www.php.cn/link/36ef259d4d9967f3a81aa326160128c7

Papier: https://www.php.cn/link/ca0525bfe5cab4c577d169d3343a5452

Das obige ist der detaillierte Inhalt vonDas schnellste Modell mit einer Auflösung von 1024, das offene ByteDance Vincent Graph-Modell SDXL-Lightning, wurde veröffentlicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Chat -Befehle und wie man sie benutzt

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7520

CakePHP-Tutorial

1378

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

Ich habe versucht, die Vibe -Codierung mit Cursor AI und es ist erstaunlich! Mar 20, 2025 pm 03:34 PM

Die Vibe -Codierung verändert die Welt der Softwareentwicklung, indem wir Anwendungen mit natürlicher Sprache anstelle von endlosen Codezeilen erstellen können. Inspiriert von Visionären wie Andrej Karpathy, lässt dieser innovative Ansatz Dev

Top 5 Genai Starts vom Februar 2025: GPT-4,5, GROK-3 & MEHR! Mar 22, 2025 am 10:58 AM

Februar 2025 war ein weiterer bahnbrechender Monat für die Generative KI, die uns einige der am meisten erwarteten Modell-Upgrades und bahnbrechenden neuen Funktionen gebracht hat. Von Xais Grok 3 und Anthropics Claude 3.7 -Sonett, um g zu eröffnen

Wie benutze ich Yolo V12 zur Objekterkennung? Mar 22, 2025 am 11:07 AM

Yolo (Sie schauen nur einmal) war ein führender Echtzeit-Objekterkennungsrahmen, wobei jede Iteration die vorherigen Versionen verbessert. Die neueste Version Yolo V12 führt Fortschritte vor, die die Genauigkeit erheblich verbessern

Ist Chatgpt 4 o verfügbar? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 ist derzeit verfügbar und weit verbreitet, wodurch im Vergleich zu seinen Vorgängern wie ChatGPT 3.5 signifikante Verbesserungen beim Verständnis des Kontextes und des Generierens kohärenter Antworten zeigt. Zukünftige Entwicklungen können mehr personalisierte Inters umfassen

Beste KI -Kunstgeneratoren (kostenlos & amp; bezahlt) für kreative Projekte Apr 02, 2025 pm 06:10 PM

Der Artikel überprüft Top -KI -Kunstgeneratoren, diskutiert ihre Funktionen, Eignung für kreative Projekte und Wert. Es zeigt MidJourney als den besten Wert für Fachkräfte und empfiehlt Dall-E 2 für hochwertige, anpassbare Kunst.

O1 gegen GPT-4O: Ist OpenAIs neues Modell besser als GPT-4O? Mar 16, 2025 am 11:47 AM

Openais O1: Ein 12-tägiger Geschenkbummel beginnt mit ihrem bisher mächtigsten Modell Die Ankunft im Dezember bringt eine globale Verlangsamung, Schneeflocken in einigen Teilen der Welt, aber Openai fängt gerade erst an. Sam Altman und sein Team starten ein 12-tägiges Geschenk Ex

Gencast von Google: Wettervorhersage mit Gencast Mini Demo Mar 16, 2025 pm 01:46 PM

Gencast von Google Deepmind: Eine revolutionäre KI für die Wettervorhersage Die Wettervorhersage wurde einer dramatischen Transformation unterzogen, die sich von rudimentären Beobachtungen zu ausgefeilten AI-angetriebenen Vorhersagen überschreitet. Google DeepMinds Gencast, ein Bodenbrei

Welche KI ist besser als Chatgpt? Mar 18, 2025 pm 06:05 PM

Der Artikel erörtert KI -Modelle, die Chatgpt wie Lamda, Lama und Grok übertreffen und ihre Vorteile in Bezug auf Genauigkeit, Verständnis und Branchenauswirkungen hervorheben. (159 Charaktere)

See all articles