Stabile Verbreitung kommt zurück?
Die neuesten Tweets und vier Videos von Stability AI CEO Emad Mostaque haben unzählige Gedanken geweckt.
Viele Internetnutzer vermuten, dass dies eine Demo der neuen Version von Stable Video Diffusion ist.
Denn aus wirkungstechnischer Sicht sind die Klarheit, Konsistenz und Glätte des Bildes allesamt erstaunlich.
Zum Beispiel taucht dieser Stoffbär mit Schwimmbrille.
Der Stoffbär bewegt sich sehr sanft und blinzelt sogar. Es gibt auch reichhaltige Details des Meerwassers dahinter.
Außerdem ist Emad Mostaque selbst seit dem 1. Januar dieses Jahres für mehrere Wochen verschwunden und nie in sozialen Netzwerken aufgetaucht.
Internetnutzer haben das Gefühl, dass diese Welle eher darin besteht, große Neuigkeiten zurückzuhalten. Stabilitäts-KI ist zurück?
(Ich dachte einmal, dass die Stabilitäts-KI im Wettbewerb zurückgefallen wäre)
Der veröffentlichten Vier-Sekunden-Demo nach zu urteilen, sollte es sich um ein Upgrade der SVD-Videogenerierungsfunktion handeln.
Allerdings ist noch nicht klar, ob die Generierung auf Text oder Bildern basiert. Lassen Sie uns den Effekt direkt spüren.
Es gibt auch diese Nachtstraße im Anime-Stil.
Im November letzten Jahres wurde Stable Video Diffusion (SVD) offiziell eingeführt. Damals unterstützte es nicht nur Bilder und Text in Videos, sondern auch die 3D-Synthese von Objekten.
Nach dem damals veröffentlichten Plan wurde SVD nur als Basismodell verwendet und wird weiter ausgebaut, um das gesamte Stable Diffusion-Ökosystem aufzubauen.
Zu den damaligen Rückmeldungen von Internetnutzern zur Demo gehörten falsche Beleuchtung und Schatten sowie allgemeine Inkohärenz (Videobilder flackern zwischen Bildern).
Schauen wir uns die aktuelle Demo an und vergleichen wir sie mit einem ähnlichen Video: Der grüne Roboter liegt auf dem Bett.
Sie können sehen, dass die Details des Roboters, der Tassen und Lampen daneben und sogar die Falten des Bettes, der Steppdecke und der Kissen reichhaltiger sind.
Und es gibt auch eine deutliche Licht- und Schattenabbildung auf dem Gesicht des Roboters.
Weitere Update-Informationen müssen jedoch warten, bis die offizielle Version veröffentlicht wird.
Es ist erwähnenswert, dass Emad Mostaque nach diesem Tweet auch einen ähnlichen gepostet hat.
Kein Text, nur vier Standbilder.
Internetnutzer äußerten ihre Erwartungen. „Ich hoffe, dass dieses Modell SDXL in allen Aspekten übertreffen und mit der Zeit besser iterieren kann.“
Aber was zum Teufel ist diese Erdtomate? ? ?
Am selben Tag wurde ihr StableLM2 1.6B veröffentlicht, ein kleines Sprachmodell mit nur 1,6 Milliarden Parametern. Es ist mehrsprachig ausgebildet in Englisch, Spanisch, Deutsch, Französisch, Portugiesisch und Niederländisch.
Vor ein paar Tagen haben sie gerade Stable Code 3B veröffentlicht, das erste große Sprachmodell seit dem neuen Jahr.
Steht bei der Stabilitäts-KI bei solch häufigen Fortschritten wirklich eine Wende bevor?
Der Grund, warum ich von einer Trendwende sprechen möchte, ist, dass Stability AI in der letzten Welle des Wenshengtu-Tracks tatsächlich viel Aufmerksamkeit erregt hat. Die Popularität von Stable Diffusion hat es einst zum meistgesehenen KI-Einhorn der Welt gemacht .
Mit dem Aufkommen von Midjourney und den häufigen Fortschritten von OpenAI und Google kam es jedoch auch zu internen Unruhen, unter anderem wurde der CEO verdächtigt, Leistungen zu plagiieren, öffentliche Gelder zu veruntreuen, das Geschäftsmodell des Unternehmens war unklar und Löhne wurden geschuldet war einmal in einem Sturm gefangen.
Im November letzten Jahres wurde offiziell bekannt gegeben, dass es in die Video-Generation-Spur einsteigen würde. Zu diesem Zeitpunkt waren bereits beliebte Player wie Runway und Pika erschienen.
Jetzt wird vermutet, dass eine neue Version von SVD vorgestellt wird. Der Grund, warum es die Aufmerksamkeit aller auf sich gezogen hat, ist, dass es neben seinem eigenen Unternehmen auch eng mit dem aktuellen High-Energy-Video-Generation-Track verbunden ist.
Viele Internetnutzer sagten unverblümt: Es ist wirklich eine Welle von Locken, eine nach der anderen.
Entweder ist es iterativ oder die Versionsveröffentlichung. In dieser Zeit sind häufig neue Entwicklungen wie Alibaba Byte, ein großer inländischer Hersteller, aufgetaucht. Entweder aufgrund der Erzeugungswirkung, Klarheit und Glätte. Vor einiger Zeit kam Moonvalley heraus und schockierte viele Menschen. 🔜 die ursprünglich stationär waren, begannen sich zu bewegen.
Sind Sie in Bezug auf die Videogenerierung optimistisch, was Stabilitäts-KI angeht?
Das obige ist der detaillierte Inhalt vonDie KI-Stabilität hat sich erneut sprunghaft verbessert: erstaunliche Demonstration der neuen Videogeneration, die von den Internetnutzern einhellig anerkannt wird. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!