MIT und Google erforschen gemeinsam die neue Technologie StableRep: Verwendung synthetischer Bilder zum Trainieren von KI-Bildmodellen-KI-php.cn

Heim

MIT und Google erforschen gemeinsam die neue Technologie StableRep: Verwendung synthetischer Bilder zum Trainieren von KI-Bildmodellen

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Nov 29, 2023 am 11:17 AM

合成图像 stablerep AI-Bildmodell

Schwerpunkt:

Forscher haben eine neue Technologie namens StableRep vorgeschlagen, die von künstlicher Intelligenz erzeugte Bilder nutzt, um hochdetaillierte Bildmodelle mit künstlicher Intelligenz zu trainieren

StableRep trainiert mit Millionen beschrifteter synthetischer Bilder, wendet eine „Lernmethode mit mehreren positiven Kontrasten“ an, um den Lernprozess zu verbessern, und wendet sie auf das Open-Source-Text-zu-Bild-Modell Stable Diffusion an

- ⚙️ Obwohl StableRep bemerkenswerte Erfolge bei der ImageNet-Klassifizierung erzielt hat, ist die Generierung von Bildern langsam und es besteht eine semantische Diskrepanz zwischen Texthinweisen und generierten Bildern.

Webmaster Home (ChinaZ.com) Neuigkeiten vom 28. November: Forscher vom MIT und Google haben kürzlich eine neue Technologie namens StableRep entwickelt, die darauf abzielt, von KI erzeugte Bilder zu verwenden, um detailliertere und effizientere KI-Bildmodelle zu trainieren. Diese Technologie wurde auf das Open-Source-Text-zu-Bild-Modell Stable Diffusion angewendet und erzielte eine Reihe bemerkenswerter Erfolge.

StableRep verwendet eine einzigartige Methode namens „Multiple Positive Contrast Learning Method“. Bei diesem Ansatz werden mehrere Bilder, die aus derselben Textaufforderung stammen, als positive Kontraste zueinander betrachtet, um den Lernprozess zu verbessern. Für die Textaufforderung im Querformat vergleicht das Modell beispielsweise mehrere generierte Landschaftsbilder mit allen relevanten Beschreibungen, um anhand dieser Bilder kleine Unterschiede zu finden und diese auf die endgültige Ausgabe anzuwenden, wodurch ein äußerst detailliertes Bild entsteht

MIT und Google erforschen gemeinsam die neue Technologie StableRep: Verwendung synthetischer Bilder zum Trainieren von KI-Bildmodellen

Die Forscher stellen fest, dass ihre Methode hervorragend darin ist, mehrere Bilder als Ausdruck desselben zugrunde liegenden Objekts zu behandeln und nicht nur als eine Ansammlung von Pixeln. Experimente haben gezeigt, dass StableRep bei der ImageNet-Klassifizierungsaufgabe unter Verwendung des Vision Transformer-Modells eine lineare Genauigkeit von 76,7 % erreichte. Darüber hinaus übertraf das auf 20 Millionen synthetischen Bildern trainierte StableRep-Modell durch die Einführung der Sprachüberwachung die Leistung des auf 50 Millionen realen Bildern trainierten CLIP-Modells

Allerdings sind stabile Generatoren nicht ohne Mängel. Es generiert Bilder langsam und leidet unter einer semantischen Diskrepanz zwischen Textaufforderungen und generierten Bildern. Darüber hinaus erfordert die stabile Diffusion, das zugrunde liegende Modell des stabilen Generators, ein anfängliches Training anhand realer Daten, sodass die Erstellung von Bildern mit dem stabilen Generator länger dauert und möglicherweise kostspieliger ist

StableRep wurde als Open Source auf GitHub bereitgestellt und steht für die kommerzielle Nutzung zur Verfügung. Es übernimmt die Apache 2.0-Lizenz, und Benutzer können sie verwenden und abgeleitete Werke erstellen, sie müssen jedoch eine Kopie der Apache-Lizenz im weitergegebenen Werk oder abgeleiteten Werk bereitstellen und einen Hinweis auf die Änderung beifügen. Die Lizenz beinhaltet auch eine Beschränkung der Haftung des Mitwirkenden für etwaige Schäden, die aus der Nutzung des lizenzierten Werks entstehen. Stable Replica (StableRep) wurde als Open Source auf GitHub veröffentlicht und kann für kommerzielle Zwecke genutzt werden. Es übernimmt die Apache2.0-Lizenz, die es Benutzern ermöglicht, abgeleitete Werke zu verwenden und zu erstellen. Bei Weiterverbreitungen oder abgeleiteten Werken müssen Benutzer jedoch eine Kopie der Apache-Lizenz bereitstellen und über vorgenommene Änderungen informieren. Diese Lizenz stellt die Mitwirkenden außerdem von jeglichem Schaden frei, der durch die Nutzung des lizenzierten Werks entsteht

Dieses Forschungsergebnis von MIT und Google stellt eine Innovation auf dem Gebiet der Bilderzeugung mit künstlicher Intelligenz dar. Obwohl es einige Mängel aufweist, bietet es eine neue Methode und Idee zum Generieren hochwertiger Bilder

Das obige ist der detaillierte Inhalt vonMIT und Google erforschen gemeinsam die neue Technologie StableRep: Verwendung synthetischer Bilder zum Trainieren von KI-Bildmodellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

1 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Wo kann man die Kransteuerungsschlüsselkarten in Atomfall finden

1 Wochen vor By DDD

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7416

CakePHP-Tutorial

1359

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

Related knowledge

Ich habe versucht, die Vibe -Codierung mit Cursor AI und es ist erstaunlich! Mar 20, 2025 pm 03:34 PM

Die Vibe -Codierung verändert die Welt der Softwareentwicklung, indem wir Anwendungen mit natürlicher Sprache anstelle von endlosen Codezeilen erstellen können. Inspiriert von Visionären wie Andrej Karpathy, lässt dieser innovative Ansatz Dev

So verwenden Sie Dall-E 3: Tipps, Beispiele und Funktionen Mar 09, 2025 pm 01:00 PM

Dall-e 3: Ein generatives KI-Bilderstellungstool Generative AI revolutioniert die Erstellung von Inhalten, und Dall-E 3, das neueste Bildgenerierungsmodell von OpenAI, steht vor der Spitze. Veröffentlicht im Oktober 2023 baut es auf seinen Vorgängern Dall-E und Dall-E 2 auf

Top 5 Genai Starts vom Februar 2025: GPT-4,5, GROK-3 & MEHR! Mar 22, 2025 am 10:58 AM

Februar 2025 war ein weiterer bahnbrechender Monat für die Generative KI, die uns einige der am meisten erwarteten Modell-Upgrades und bahnbrechenden neuen Funktionen gebracht hat. Von Xais Grok 3 und Anthropics Claude 3.7 -Sonett, um g zu eröffnen

Wie benutze ich Yolo V12 zur Objekterkennung? Mar 22, 2025 am 11:07 AM

Yolo (Sie schauen nur einmal) war ein führender Echtzeit-Objekterkennungsrahmen, wobei jede Iteration die vorherigen Versionen verbessert. Die neueste Version Yolo V12 führt Fortschritte vor, die die Genauigkeit erheblich verbessern

Elon Musk & Sam Altman kämpfen über 500 Milliarden US -Dollar Stargate -Projekt Mar 08, 2025 am 11:15 AM

Das 500 -Milliarden -Dollar -Stargate AI -Projekt, das von Tech -Giganten wie Openai, Softbank, Oracle und Nvidia unterstützt und von der US -Regierung unterstützt wird, zielt darauf ab, die amerikanische KI -Führung zu festigen. Dieses ehrgeizige Unternehmen verspricht eine Zukunft, die von AI Advanceme geprägt ist

Sora vs Veo 2: Welches erstellt realistischere Videos? Mar 10, 2025 pm 12:22 PM

Google's Veo 2 und Openais Sora: Welcher AI -Videogenerator regiert oberste? Beide Plattformen erzeugen beeindruckende KI -Videos, aber ihre Stärken liegen in verschiedenen Bereichen. Dieser Vergleich unter Verwendung verschiedener Eingabeaufforderungen zeigt, welches Werkzeug Ihren Anforderungen am besten entspricht. T

Gencast von Google: Wettervorhersage mit Gencast Mini Demo Mar 16, 2025 pm 01:46 PM

Gencast von Google Deepmind: Eine revolutionäre KI für die Wettervorhersage Die Wettervorhersage wurde einer dramatischen Transformation unterzogen, die sich von rudimentären Beobachtungen zu ausgefeilten AI-angetriebenen Vorhersagen überschreitet. Google DeepMinds Gencast, ein Bodenbrei

Welche KI ist besser als Chatgpt? Mar 18, 2025 pm 06:05 PM

Der Artikel erörtert KI -Modelle, die Chatgpt wie Lamda, Lama und Grok übertreffen und ihre Vorteile in Bezug auf Genauigkeit, Verständnis und Branchenauswirkungen hervorheben. (159 Charaktere)

See all articles