Openai hat Sora am dritten Tag ihrer 12 -Days of Openai -Serie offiziell veröffentlicht. Nach monatelangen Spannungen seit seiner ersten Ankündigung im April 2024 hat sich Sora als großer Sprung im Bereich von AI-generierten Videoinhalten erwiesen. OpenAI veröffentlichte das Sora Turbo-Modell, die hochwertige beschleunigte Version des ursprünglichen Sora-Modells. Schauen wir uns neu hinzugefügte Funktionen an und probieren Sie sie aus!
Unser Urlaubsgeschenk an Sie: Sora ist hier. https://t.co/Uhdmyughtt pic.twitter.com/ljoruqsfo0
- Openai (@openai) 9. Dezember 2024
Inhaltsverzeichnis
- Was ist Sora?
- Fähigkeiten von Openai Sora
- Openai Sora zum Testen setzen
- Wie kann ich Sora zugreifen?
- Openai Sora Features
- Separates Produkt
- Videoerstellung und Bearbeitung
- Bild -Upload und Verbesserung des Bildes
- Themen (Voreinstellungen)
- Seitenverhältnisauswahl
- Videodauer
- Text- und Bildintegration
- Storyboard (Erweiterte Erstellung)
- Videoqualität und -auflösung
- Soras technische Grundlagen
- Ethische Überlegungen von Openai Sora
- Key Takeaways
- Abschluss
Was ist Sora?
Sora ist ein Text-zu-Video-Generator , der erweiterte Diffusionsmodelle und Transformatorarchitekturen verwendet, um Videos basierend auf schriftlichen Beschreibungen zu erstellen. Diese Videos werden durch Beginn mit Rauschen erzeugt und es über mehrere Schritte hinweg schrittweise verfeinert. Dieser Diffusionsprozess ermöglicht es dem Modell, realistische, kohärente Videosequenzen aus einer Vielzahl von Texteingängen zu erstellen.
Sora baut auf den früheren Erfolgen von OpenAI mit GPT , Dall · E und Clip auf und führt einen großen Sprung nach vorne vor, indem Benutzer Videos von Grund auf neu erstellen oder vorhandene auf den Textanforderungen erweitern können. Unabhängig davon, ob ein völlig neues Video generiert oder ein Bild animiert wird, Soras Fähigkeit, visuell überzeugende Erzählungen direkt aus der natürlichen Sprache zu erstellen, ist beispiellos.
Fähigkeiten von Openai Sora
- Generieren Sie Videos aus Text: Erstellen Sie Videos aus einfachen Textaufforderungen.
- Erweitern Sie vorhandene Videos: Fortsetzung vorhandene Videos oder ändern Sie.
- Animate Images: Stillbilder mit Animation zum Leben erwecken.
- Umgang mit komplexen Szenen: Behalten Sie die Kontinuität über mehrere Frames hinweg auf.
- Skalieren und anpassen: Generieren Sie Videos in verschiedenen Formaten und Längen.
- Videos transformieren: Vorhandene Videos basierend auf Texteingabeaufforderungen ändern.
Schlüsselverbesserungen
- Realistische Physik: natürlichere Objektbewegung.
- Längere Videos: Erstellen Sie Videos bis zu 20 Sekunden.
- Verbesserte Beleuchtung: Visuell ansprechende Videos mit dynamischen Beleuchtungseffekten.
Openai Sora zum Testen setzen
Eingabeaufforderung: Erstellen Sie ein Video über weißes Hund, das mit Kätzchen spielt
Eingabeaufforderung: Erstellen Sie ein Video eines tanzenden Hundes am Strand.
Storyboard -Eingabeaufforderung
Prompt:
- Eine lebendige Animation zeigt ein psychotropes Molekül, das als kleines, leuchtendes Teilchen in den Mund dargestellt wird. Der Hintergrund ist eine stilisierte Darstellung des menschlichen Verdauungssystems mit wirbelnden Farben, die auf den Beginn einer komplexen Reise hinweisen.
- Das Molekül reist durch den Blutkreislauf, umgeben von roten und weißen Blutkörperchen. Es wird als helles, lumineszierendes Partikel dargestellt, das sich schnell durch ein Netzwerk von Blutgefäßen bewegt.
- Das Molekül erreicht die als schimmernde Wand dargestellte Blut-Hirn-Schranke und dringt in das Gehirn ein. Die Szene wird komplizierter, wobei Neuronen und Synapsen aufleuchten, wenn das Molekül mit ihnen interagiert.
Prompt:
- In einem warm beleuchteten Kinderzimmer sitzen ein kleiner Junge und ein kleines Mädchen in einer gemütlichen provisorischen Jurte aus karierten Decken und Kissen. Sie sind in spielerischen Hüten und Filzstiefeln gekleidet, umgeben vom weichen Leuchten von Lampen. Die Kinder kichern, während sie mit einem Spielzeugrentier spielen und ihre Augen vor Fantasie funkeln.
- Die Kinder schließen ihre Augen fest, ein Gefühl der Vorfreude in der Luft.
- Während sie ihre Augen öffnen, verwandeln sie sich in Erwachsene und stehen vor einer modernen Hotellandschaft in Yakutia, umgeben von echten Jurten und einer riesigen, schneebedeckten Winterszene.
Beobachtung: Während ich die Videos mit dem Chatgpt Plus -Konto erstellen konnte, habe ich viel Zeit gebraucht, ich sehe, dass es viel Umfang der Verbesserung gibt.
Wie kann ich Sora zugreifen?
Sora kann über die neue Website - Sora.com - erhoben werden. Sie können Ihre Chatgpt -Pläne verwenden, um Zugriff auf das Modell zu erhalten:
- CHATGPT Plus -Konto : Dieser Plan bietet Ihnen 50 Generationen pro Monat . Diese könnten mit der Anzahl der Text-zu-Video-Kreationen oder anderer spezifischer Aufgaben pro Monat zusammenhängen.
- OpenAI Pro -Konto : Dies bietet unbegrenzte Generationen im langsamen Warteschlangenmodus sowie 500 schnellere Generationen pro Monat. Diese Stufe scheint sich darauf zu konzentrieren, mehr Flexibilität anzubieten, mit der Option, Aufgaben für eine bestimmte Anzahl von Generationen schneller zu bearbeiten, während andere Aufgaben möglicherweise langsamer in die Warteschlange gestellt und verarbeitet werden.
- Verfügbarkeit : Der Service wird Großbritannien und EU beim Start nicht zur Verfügung stehen, was möglicherweise auf rechtliche, regulatorische oder Datenschutzüberlegungen (wie die DSGVO) zurückzuführen ist. Diese Einschränkung könnte in Zukunft aufgehoben werden, wenn sie in mehr Regionen expandieren.
Openai Sora Features

Separates Produkt
- Sora ist ein eigenständiges Produkt, das nicht in Chatgpt oder andere OpenAI -Plattformen integriert ist.
- Zugriff über Sora.com , wo kürzlich generierte und kuratierte Videos angezeigt werden.
Videoerstellung und Bearbeitung
- Generieren Sie Videos aus Eingabeaufforderungen : Benutzer können Videos basierend auf Texteingabeaufforderungen erstellen.
- Bilder hochladen : Benutzer können auch Bilder hochladen, mit denen Sora Videos generieren kann.
- Re-mix-Funktion : Ermöglicht Benutzern, Änderungen vorhandenen Videos durch Beschreibung der gewünschten Änderungen vorzunehmen.
- Krafteinstellung : Steuert, wie drastisch das Video verändert wird, wobei höhere Einstellungen zu künstlerischeren Veränderungen führen.
- Videobearbeitung : Sora kann auch Videos bearbeiten, die ursprünglich vom Tool generiert wurden.
Bild -Upload und Verbesserung des Bildes

- Bilder hochladen: Sie können zunächst ein Bild hochladen, um ein Video zu erstellen. Dieses Bild kann als Basis dienen, und Sie können es mit weiteren Elementen, Text oder Animation erweitern.
- Textbeschreibung: Sie können das Bild auch mit Text beschreiben. Je detaillierter Ihre Beschreibung ist, desto spezifischer folgt die Videoerstellung Ihren Anweisungen. Für weniger detaillierte Beschreibungen füllt das Tool die Lücken mit allgemeiner Kreativität und Details.
Themen (Voreinstellungen)

- Sora bietet verschiedene Voreinstellungen, mit denen das Gesamtthema des Videos definiert werden kann. Einige Beispiele sind:
- Ballonwelt: Diese Voreinstellung kann eine skurrile oder traumhafte Atmosphäre schaffen.
- Stopp Motion: Ein Voreinstellung, das den Stop-Motion-Animationsstil nachahmt und Ihrem Video einen handgefertigten Aussehen von Frame-by-Frame verleiht.
Seitenverhältnisauswahl
- Sie können das Seitenverhältnis für Ihr Video auswählen. Einige gängige Optionen sind:
- 16: 9 (Breitbildschirm): Ideal für die meisten Videos, insbesondere für YouTube, Breitbildfilme usw.
- 1: 1 (Quadrat): Geeignet für Social -Media -Beiträge wie Instagram.
- 9:16 (vertikal): Perfekt für Plattformen wie Tiktok oder Instagram Stories.
Videodauer

- Sie können die Dauer Ihres Videos auf bis zu 20 Sekunden festlegen, sodass Sie Flexibilität geben, wie viel Inhalt enthalten ist.
Text- und Bildintegration
- Die Plattform ermöglicht die Kombination von Text und Bildern für den kreativen Ausdruck:
- Erstellen Sie durch Hochladen von Bildern: Sie laden ein Bild hoch, um als Grundlage für Ihr Video zu dienen, und erweitern oder animieren Sie es mit zusätzlichen Inhalten.
- Textbasierte Erstellung: Sie können Szenen oder Bilder mit Text beschreiben. Je spezifischer der Text, desto mehr folgt das Video Ihrer Richtung. In einer detaillierten Beschreibung wird beispielsweise das Video so leitet, dass die genauen Elemente, die Sie erwähnt haben, replizieren.
Storyboard (Erweiterte Erstellung)

- Für komplexere Videoprojekte können Sie die Videoerstellung entlang einer Zeitleiste leiten . Dies enthält:
- Kontrolle über Sequenz: Sie können die Reihenfolge der Elemente (Text, Bilder und Videos) definieren.
- Erweiterte Bearbeitung: Es ermöglicht genauere Anpassungen und Sequenzierung von Szenen.
- Multimedia -Integration: Sie können Bilder, Text und Videoclips kombinieren, um eine narrative oder komplexe visuelle Geschichte zu erstellen.
Videoqualität und -auflösung

- Auflösungsoptionen : Generieren Videos bis zu 1080p -Auflösung.
- Das Generieren von 1080p -Filmmaterial dauert 8x länger im Vergleich zu 480p, was die schnellste Option ist.
- 720p dauert 4x länger als 480p.
- 480p ist am schnellsten.
- Durchschnittliche Generierungszeit : Ein paar Minuten für ein 1080p -Video (vorbehaltlich der Nutzerbedarf und des Verkehrs).
Kurzgesagt,
Sora ist eine flexible, benutzerfreundliche Videoerstellungsplattform mit leistungsstarken Anpassungsoptionen. Du kannst:
- Laden Sie Bilder hoch oder beschreiben Sie Szenen mit Text.
- Wählen Sie aus verschiedenen Themenvorstellungen wie Ballonwelt oder stoppen Sie Bewegung.
- Kontroll -Seitenverhältnis und Videodauer.
- Verwenden Sie den Storyboard -Modus für erweiterte Videobearbeitung und -sequenzierung.
Diese Kombination von Funktionen erleichtert den Benutzern, auch mit minimalem technischem Wissen ansprechende, professionell aussehende Videos zu erstellen.
Diese Funktionen sind Sura als leistungsstarke, aber immer noch im Rahmen des Implementierters für kreative Videoinhalte, insbesondere für nicht-photorealistische, stilisierte Projekte.
Soras technische Grundlagen
Sora basiert grundsätzlich auf dem Diffusionsmodell , einer Technik, die mit zufälligem Rauschen beginnt und es iterativ in ein kohärentes Video verfeinert. Dieser Prozess spiegelt wider, wie herkömmliche Bild-zu-Im-Im---D- Diffusionsmodelle funktionieren, jedoch mit der zusätzlichen Komplexität von Videosequenzen.
Der Schlüssel zu Soras Innovation ist die Verwendung von Patch-basierter Darstellung für Bilder und Videos. Ähnlich wie bei Token in GPT werden Videos und Bilder in Sora in kleinere „Patches“ von Daten unterteilt. Dadurch kann das Modell große und komplexe visuelle Daten effizienter verarbeiten und damit Videos über verschiedene Dauer und Auflösungen hinweg generieren können.
Darüber hinaus baut Sora auf der in Dall · E 3 verwendeten Rekaptionierungstechnik auf, sodass sie sehr beschreibende Bildunterschriften für seine Trainingsdaten generieren können. Diese Fähigkeit ermöglicht es dem Modell, die textlichen Eingabeaufforderungen genau zu befolgen, was zu Videos führt, die den Benutzeranweisungen treu sind und mehr mit der Eingabebeschreibung ausgerichtet sind.
Lesen Sie auch: Was ist Openais Sora Diffusion Transformator (DIT)?
Ethische Überlegungen von Openai Sora
Hier ist, was Sora von Ihnen erwartet:
- Einwilligung : Nur Medien hochladen, die Menschen mit ihrer expliziten Erlaubnis enthalten, und stellen Sie sicher, dass diese unter 18 Jahren eine angemessene Zustimmung haben.
- Gewalt und explizite Themen : Laden Sie keine Inhalte hoch, die Gewalt, explizite Themen oder erwachsenes Material darstellen.
- Medienrechte : Stellen Sie sicher, dass Sie über das erforderliche Eigentum oder die erforderlichen Rechte verfügen, die von Ihnen geteilten Medien hochzuladen.
- Konsequenzen : Missbrauch der Plattform durch Verstoß gegen diese Regeln kann zu einer Aussetzung des Kontos oder zum Verbot ohne Rückerstattung führen.
Key Takeaways
OpenAIs Sora ist ein Text-zu-Video-Generator mit Funktionen wie Themen, Storyboard-Modus und Auflösungen bis zu 1080p. Es hat jedoch bemerkenswerte Einschränkungen. Videos sind mit 20 Sekunden begrenzt, die möglicherweise nicht längere Erzählungen entsprechen. Das hochauflösende Rendering (z. B. 1080p) ist zeitintensiv und verlangsamt sich im Vergleich zu niedrigeren Auflösungen signifikant. Derzeit ist Sora in Großbritannien/EU aufgrund von regulatorischen Problemen nicht verfügbar und begrenzt den Zugang. Darüber hinaus beschränken ethische Richtlinien die Nutzung und Verstößenrisikoaufsetzung. Sora ist leistungsstark, entwickelt sich aber immer noch weiter, mit Raum für technische und Zugänglichkeitsverbesserungen. Außerdem ist die Geschwindigkeit der Erzeugung ziemlich langsam, und es liegt an den hochauflösenden Videos. Aber ich hoffe, dass es sich im Laufe der Zeit verbessern wird, da OpenAI das Modell und seine zugrunde liegende Infrastruktur weiter optimiert. Zukünftige Updates können schnellere Geschwindigkeiten bringen, ohne die Qualität hochauflösender Videos zu beeinträchtigen, wodurch der Prozess effizienter und benutzerfreundlicher wird.
Abschluss
Soras endgültige Veröffentlichung ist ein bemerkenswerter Meilenstein in der Entwicklung künstlicher Intelligenz und kombiniert die neuesten Fortschritte in der Verarbeitung natürlicher Sprache (NLP) , Computer Vision und Deep Learning , um qualitativ hochwertige Kurzformvideos direkt aus Textaufforderungen zu generieren. Die potenziellen Auswirkungen dieser Technologie sind weitreichende, von der Kreativbranche über Bildung, Marketing und darüber hinaus.
OpenAIs Vision für das Modell ist weitreichend, mit dem ultimativen Ziel, Systeme zu schaffen, die die reale Welt simulieren können, und uns der Verwirklichung der künstlichen allgemeinen Intelligenz (AGI) einen Schritt näher bringen. Während sich Sora weiterentwickelt, werden seine Fähigkeiten wahrscheinlich erweitert und fortgeschrittenere Funktionen wie die Echtzeit-Videogenerierung, das interaktive Geschichtenerzählen und sogar die Integration in die virtuelle und erweiterte Realität einbeziehen.
Hast du es versucht? Lassen Sie mich Ihre Gedanken im Kommentarbereich unten wissen!
Das obige ist der detaillierte Inhalt vonIch habe Openai Sora getestet und hier entdeckte ich das, was ich entdeckt habe. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!