Wollten Sie schon immer Ihre DALL-E 3-Kreation sofort bearbeiten, wussten aber nicht, wie Sie die Änderungen vornehmen sollen?
OpenAI hört Ihnen zu und hat DALL-E 3 in ChatGPT Inline-Bearbeitungstools hinzugefügt, mit denen Sie Änderungen an Ihren Kreationen vornehmen können, ohne die App zu verlassen.
Das einzige Problem ist, dass sie nicht das tun, was OpenAI bewirbt, und es ist unklar, ob Sie die gewünschten Änderungen erhalten. Dennoch ist es ein Anfang dessen, was für die Bearbeitung mit DALL-E 3 noch kommen wird, und so funktionieren sie.
Es hat eine Weile gedauert, aber OpenAI hat in ChatGPT Plus endlich Bearbeitungsfunktionen zu DALL-E 3 hinzugefügt. Zuvor konnten Sie versuchen, Änderungen an Ihren DALL-E 3-Kreationen vorzunehmen, aber das führte normalerweise immer dazu, dass ein völlig neues Bild generiert wurde. Selbst wenn die zum Erstellen des bearbeiteten Bilds verwendeten Eingabeaufforderungen der ersten Eingabeaufforderung sehr ähnlich wären, könnte die Ausgabe aufgrund der Natur der generativen KI erheblich unterschiedlich sein.
Die integrierten Bearbeitungstools von DALL-E 3 zielen jetzt darauf ab, Probleme innerhalb desselben Bildes zu beheben, ohne eine neue Eingabeaufforderung zu erstellen. Sie markieren einen Bereich im Bild, den Sie anpassen möchten, fordern DALL-E auf, eine bestimmte Änderung vorzunehmen (z. B. „dieses entfernen“ oder „diese Funktion hinzufügen“), und schon geht es los.
Allerdings ist es eine gemischte Sache.
Das offizielle Blog-Beispiel von OpenAI zeigt, wie DALL-E Kirschblüten zu einem Bild einer Katze im Ukiyo-e-Stil hinzufügt, und es funktioniert perfekt. Meiner Erfahrung nach fällt es den Bearbeitungstools von DALL-E schwer, solch detaillierte Bilder zu einem vorhandenen Bild hinzuzufügen, und Anfragen dieser Art können größtenteils nicht bearbeitet werden.
Das heißt nicht, dass die Bearbeitungstools nicht funktionieren. Sie können durchaus Funktionen entfernen und kleine Änderungen vornehmen, wie unten beschrieben, aber das alles in kleinem Maßstab.
Der beste Weg, Ihnen zu zeigen, was das Bearbeitungstool von DALL-E 3 kann, sind einige geeignete Beispiele.
Die Bearbeitungstools von DALL-E 3 können einige kleine Funktionen löschen, aber es ist definitiv schwierig. Im folgenden Bild hatte ich DALL-E gebeten, „Eine Roboterhand zu erstellen, die einen leuchtenden, transparenten quadratischen Chip mit der Aufschrift „AI Accelerated“ hält. Der Hintergrund ist dunkelblau und schafft eine futuristische und High-Tech-Atmosphäre.“
Da das Schreiben von Text ein besonderes Problem für die generative KI ist, wundert es mich nicht, dass der Text falsch war – also habe ich DALL-E gebeten, den Rechtschreibfehler zu entfernen. Beim ersten Versuch scheiterte es mit der Aufforderung „Bitte entfernen Sie dieses Wort“, beim zweiten Versuch gelang es jedoch mit der Aufforderung „Bitte entfernen Sie dieses Wort aus dem Bild“. Also, Erfolg, ja, aber Sie müssen möglicherweise verschiedene Eingabeaufforderungen ausprobieren, um ein Ergebnis zu erhalten. Ich habe es dann gebeten, die KI-Buchstaben in die Mitte des Quadrats zu verschieben, was trotz eines Absturzes meines PCs aus irgendeinem Grund gut funktionierte.
Als nächstes bat ich DALL-E, mir bei der Bearbeitung eines Bildes eines Fernsehers mit statischem Rauschen zu helfen. DALL-E eignet sich hervorragend zum Generieren einzigartiger Bilder, es werden jedoch einige Details falsch wiedergegeben oder der Text wird verzerrt angezeigt. In diesem Fall zeigt die Informationsleiste auf dem Fernsehbildschirm Kauderwelsch-KI-Text an, daher wollte ich ihn entfernen. Der erste Versuch von DALL-E hinterließ einen Schatten an der Stelle, an der sich die Informationsleiste befand, während der zweite und dritte Versuch viel sauberer waren. Nicht perfekt, aber ausreichend für den Zweck, für den ich das Bild verwendet habe.
DALL-E 3 kann einige Änderungen an Bildern vornehmen, aber auch hier kommt es auf den Umfang Ihrer Anforderungen an. Kleinere Ergänzungen und Änderungen sind möglich, aber meistens kann das Bearbeitungstool von DALL-E nicht verarbeiten, was gefragt wird.
Ich habe DALL-E gebeten, „ein 2:1 4K-Bild eines menschlichen Auges aus nächster Nähe und detailliert zu erstellen“, was zu folgendem Bild führte:
Ziemlich anständig, wenn auch etwas seltsam (Wimpernreflexionen?!), aber ich wollte stattdessen die Irisfarbe auf Blaugrün ändern, was zu diesem Bild führte:
Die Farbe ist leicht matt, aber unverändert, und einige Merkmale sind leicht verzerrt.
Als nächstes forderte ich DALL-E auf, „ein 4k-2:1-Claymation-Bild einer Person zu erstellen, die einen Tiger-Strampler trägt und einen Hang hinunterfährt, mit einem Yeti-Hintergrund.“
Auch hier ist das Originalbild gut, hat scharfe, lebendige Farben und entspricht der Aufforderung. Allerdings wollte ich den Yeti durch eine andere Art gruseliges Tier ersetzen.
Anstatt den Yeti gegen ein anderes Tier auszutauschen, ist er einfach komplett weg. Stattdessen kehrte ich zum Originalbild zurück und bat es, einen weiteren Yeti hinzuzufügen, was nicht gelang. Auch die Aufforderung, dem Bild weitere Bäume hinzuzufügen, schlug fehl.
Hier gibt es nicht viel zu behandeln. Wie bereits erwähnt, hat generative KI im Allgemeinen ohnehin Probleme mit Text, und das Hinzufügen von Text zu einem Bild ist noch schwieriger. Ich habe DALL-E aufgefordert, eine Postkarte von einem britischen Küstenort zu erstellen, was auch der Fall war und die Szene gut eingefangen hat. Ich wollte dem Bild dann die Worte „Sunny Beach“ hinzufügen, was einfach nicht möglich war. Das heißt, bis nach etwa sechs oder sieben Hin- und Her-Aufforderungen, die DALL-E daran erinnerten, was es tun musste, ein völlig neues Bild mit dem erforderlichen Text erstellt wurde. Und auch korrekter Text; Bei dem Babygesicht im Sonnenschein bin ich mir allerdings nicht sicher.
Als nächstes habe ich mich für eine Geburtstagskarte entschieden. Dieses Mal fügte DALL-E „Happy Birthday“ hinzu, ohne dazu aufgefordert zu werden, was angesichts des Themas in Ordnung ist. Also habe ich darum gebeten, das Geburtstagsdatum auf der Karte anzugeben. Auch hier gelang es nicht, das Datum zur Karte hinzuzufügen, aber nach einigen Aufforderungsrunden wurde ein neues Bild mit dem angeforderten Datum erstellt. In diesem Fall wäre es einfacher gewesen, das Datum selbst hinzuzufügen, insbesondere wenn ich das Originalbild behalten wollte.
Ich habe festgestellt, dass die Bearbeitungswerkzeuge von DALL-E für bestimmte Aufgaben nützlich sind, aber es dauert einige Zeit, bis die Bearbeitung richtig ist. In anderen Fällen funktioniert es einfach nicht, und es ist wahrscheinlich besser, wenn Sie Ihre ursprüngliche Eingabeaufforderung übernehmen und diese anpassen, um ein neues Bild zu erstellen.
Die Bearbeitungstools von DALL-E werden sich mit der Zeit wahrscheinlich verbessern, aber bis dahin ist es vielleicht besser, Ihr Bild mit einem Bildbearbeitungstool zu bearbeiten, als mehrere zeitaufwändige Gesprächsrunden mit DALL-E zu durchlaufen. Wenn es funktioniert, ist es gut; Wenn es die Bearbeitung nicht versteht oder überhaupt nicht durchführt, ist das frustrierend.
Das obige ist der detaillierte Inhalt vonDALL-E 3 verfügt jetzt über integrierte Bearbeitungstools, aber sie müssen noch bearbeitet werden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!