


Das Diffusionsmodell überwindet algorithmische Probleme, AGI ist nicht mehr weit! Google Brain findet den kürzesten Weg in einem Labyrinth
Kann das „Diffusionsmodell“ auch algorithmische Probleme überwinden?
Bilder
Ein Doktorand hat ein interessantes Experiment durchgeführt, bei dem er „diskrete Diffusion“ nutzte, um den kürzesten Weg in einem Labyrinth zu finden, das durch ein Bild dargestellt wird.
Bilder
Nach Angaben des Autors entsteht jedes Labyrinth durch wiederholtes Hinzufügen horizontaler und vertikaler Wände.
Unter diesen werden der Startpunkt und der Zielpunkt zufällig ausgewählt.
Probieren Sie zufällig einen Pfad als Lösung aus, vom kürzesten Weg vom Startpunkt zum Zielpunkt. Der kürzeste Weg wird mithilfe eines exakten Algorithmus berechnet.
Bilder
Dann verwenden Sie das diskrete Diffusionsmodell und U-Net.
Der Startpunkt und das Ziellabyrinth werden in einem Kanal codiert, und das Modell verwendet die Lösung in einem anderen Kanal, um das Rauschen des Labyrinths zu eliminieren.
Bilder
Auch wenn das Labyrinth etwas schwieriger ist, kann man es trotzdem gut schaffen.
Bilder
Um den Entrauschungsschritt p(x_{t-1} | x_t) abzuschätzen, schätzt der Algorithmus p(x_0 | x_t). Die Visualisierung dieser Schätzung (untere Zeile) während des Prozesses zeigt die „aktuellen Annahmen“ und konzentriert sich letztendlich auf die Ergebnisse.
Bilder
Der leitende Wissenschaftler von NVIDIA, Jim Fan, sagte, dass dies ein interessantes Experiment sei und das Diffusionsmodell den Algorithmus „rendern“ könne. Es kann Labyrinthdurchquerungen nur aus Pixeln implementieren, sogar mit U-Net, das viel schwächer als Transforme ist.
Ich dachte immer, dass das Diffusionsmodell der Renderer und der Transformer die Inferenz-Engine ist. Es scheint, dass der Renderer selbst auch sehr komplexe sequentielle Algorithmen kodieren kann.
Bild
Dieses Experiment schockierte die Internetnutzer einfach: „Was kann das Diffusionsmodell sonst noch?!“ Durch das Training des Diffusionstransformators wird AGI das Problem lösen.
Bilder
Diese Studie wurde jedoch noch nicht offiziell veröffentlicht und der Autor sagte, dass sie später auf arxiv aktualisiert wird.
Es ist erwähnenswert, dass sie in diesem Experiment das vom Google Brain-Team im Jahr 2021 vorgeschlagene diskrete Diffusionsmodell verwendet haben.
Bilder
Erst kürzlich wurde diese Studie für eine Neuauflage aktualisiert.
Diskretes Diffusionsmodell
„Generatives Modell“ ist das Kernproblem beim maschinellen Lernen.
Es kann sowohl zur Messung unserer Fähigkeit, Statistiken zu natürlichen Datensätzen zu erfassen, als auch für nachgelagerte Anwendungen verwendet werden, die hochdimensionale Daten wie Bilder, Text und Sprache generieren müssen.
GAN, VAE, große autoregressive neuronale Netzwerkmodelle, normalisierter Fluss und andere Methoden haben ihre eigenen Vorteile in Bezug auf Probenqualität, Abtastgeschwindigkeit, Protokollwahrscheinlichkeit und Trainingsstabilität.
In letzter Zeit ist das „Diffusionsmodell“ zur beliebtesten Alternative für die Bild- und Audioerzeugung geworden.
Es kann eine mit GAN vergleichbare Stichprobenqualität und eine mit autoregressiven Modellen vergleichbare Log-Likelihood mit weniger Inferenzschritten erreicht werden.
Bilder
Papieradresse: https://www.php.cn/link/46994a3cd8d943d03b44b8fc9792d435
Obwohl einige Leute kürzlich Diffusionsmodelle für diskrete und kontinuierliche Zustandsräume vorgeschlagen haben Die Forschung konzentrierte sich hauptsächlich auf Gaußsche Diffusionsprozesse, die im kontinuierlichen Zustandsraum ablaufen (z. B. reelle Bilder und Wellenformdaten).
Diffusionsmodelle diskreter Zustandsräume wurden in den Bereichen Text- und Bildsegmentierung untersucht, haben sich jedoch bei umfangreichen Text- und Bildgenerierungsaufgaben noch nicht als wettbewerbsfähiges Modell erwiesen.
Das Google-Forschungsteam schlug ein neues diskretes Entrauschungs-Diffusionswahrscheinlichkeitsmodell (D3PM) vor.
In der Studie zeigten die Autoren, dass die Wahl der Übermatrix eine wichtige Designentscheidung ist, die die Ergebnisse sowohl im Bild- als auch im Textbereich verbessern kann.
Darüber hinaus schlugen sie eine neue Verlustfunktion vor, die eine Variationsuntergrenze und einen zusätzlichen Kreuzentropieverlust kombiniert.
In Bezug auf Text erzielt dieses Modell gute Ergebnisse bei der Textgenerierung auf Zeichenebene und ist gleichzeitig auf den großen Vokabular-LM1B-Datensatz skalierbar.
Auf dem CIFAR-10-Bilddatensatz nähert sich das neueste Modell der Stichprobenqualität des kontinuierlichen raumbezogenen DDPM-Modells an und übertrifft die Log-Likelihood des kontinuierlichen raumbezogenen DDPM-Modells.
Bilder
Projektautor
Arnaud Pannatier
Arnaud Pannatier ab März 2020 unter Mentor François Fleur et Die Gruppe für maschinelles Lernen beginnt ein Ph.D.
Er hat kürzlich HyperMixer entwickelt und dabei ein Supernetzwerk verwendet, um MLPMixer die Verarbeitung von Eingaben unterschiedlicher Länge zu ermöglichen. Dadurch kann das Modell die Eingabe auf permutationsinvariante Weise verarbeiten und verleiht dem Modell nachweislich ein Aufmerksamkeitsverhalten, das linear mit der Länge der Eingabe skaliert.
An der EPFL erhielt er einen Bachelor-Abschluss in Physik und einen Master-Abschluss in Informatik und Ingenieurwesen (CSE-MASH).
Referenzen:
Das obige ist der detaillierte Inhalt vonDas Diffusionsmodell überwindet algorithmische Probleme, AGI ist nicht mehr weit! Google Brain findet den kürzesten Weg in einem Labyrinth. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Mit der Popularität von Kryptowährungen sind virtuelle Währungshandelsplattformen entstanden. Die zehn besten Handelsplattformen der virtuellen Währung der Welt werden nach dem Transaktionsvolumen und dem Marktanteil wie folgt eingestuft: Binance, Coinbase, FTX, Kucoin, Crypto.com, Kraken, Huobi, Gate.io, Bitfinex, Gemini. Diese Plattformen bieten eine breite Palette von Dienstleistungen, die von einer Vielzahl von Kryptowährungsauswahl bis hin zu Derivatenhandel reichen und für Händler unterschiedlicher Ebene geeignet sind.

Es gibt viele Möglichkeiten, Bootstrap -Bilder zu zentrieren, und Sie müssen keine Flexbox verwenden. Wenn Sie nur horizontal zentrieren müssen, reicht die Text-Center-Klasse aus. Wenn Sie vertikal oder mehrere Elemente zentrieren müssen, ist Flexbox oder Grid besser geeignet. Flexbox ist weniger kompatibel und kann die Komplexität erhöhen, während das Netz leistungsfähiger ist und höhere Lernkosten hat. Bei der Auswahl einer Methode sollten Sie die Vor- und Nachteile abwägen und die am besten geeignete Methode entsprechend Ihren Anforderungen und Vorlieben auswählen.

Wie kann ich den Sesam offenen Austausch an Chinesisch anpassen? Dieses Tutorial behandelt detaillierte Schritte zu Computern und Android -Mobiltelefonen, von der vorläufigen Vorbereitung bis hin zu operativen Prozessen und dann bis zur Lösung gemeinsamer Probleme, um die Sesam -Open Exchange -Schnittstelle auf Chinesisch zu wechseln und schnell mit der Handelsplattform zu beginnen.

Zu den zehn Top -Kryptowährungsplattformen gehören: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.

Die Berechnung von C35 ist im Wesentlichen kombinatorische Mathematik, die die Anzahl der aus 3 von 5 Elementen ausgewählten Kombinationen darstellt. Die Berechnungsformel lautet C53 = 5! / (3! * 2!), Was direkt durch Schleifen berechnet werden kann, um die Effizienz zu verbessern und Überlauf zu vermeiden. Darüber hinaus ist das Verständnis der Art von Kombinationen und Beherrschen effizienter Berechnungsmethoden von entscheidender Bedeutung, um viele Probleme in den Bereichen Wahrscheinlichkeitsstatistik, Kryptographie, Algorithmus -Design usw. zu lösen.

Top Ten Ten Virtual Currency Trading Platforms 2025: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.

Eine sichere und zuverlässige Plattform für digitale Währung: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.

Empfohlene Safe Virtual Currency Software Apps: 1. OKX, 2. Binance, 3. Gate.io, 4. Kraken, 5. Huobi, 6. Coinbase, 7. Kucoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini. Sicherheit, Liquidität, Handhabungsgebühren, Währungsauswahl, Benutzeroberfläche und Kundensupport sollten bei der Auswahl einer Plattform berücksichtigt werden.
