Vous avez toujours voulu modifier votre création DALL-E 3 immédiatement mais vous ne saviez pas comment effectuer les modifications ?
OpenAI vous entend et a ajouté des outils d'édition en ligne à DALL-E 3 dans ChatGPT, vous permettant d'apporter des modifications à vos créations sans quitter l'application.
Le seul problème est qu'ils ne font pas ce qu'OpenAI annonce, et c'est un mélange mitigé quant à savoir si vous obtiendrez les modifications souhaitées. Mais c'est quand même le début de ce qui va arriver pour le montage DALL-E 3, et c'est ainsi qu'ils fonctionnent.
Cela a mis du temps à arriver, mais OpenAI a finalement ajouté une fonctionnalité d'édition à DALL-E 3 dans ChatGPT Plus. Avant cela, vous pouviez tenter d'apporter des modifications à vos créations DALL-E 3, mais cela entraînerait généralement toujours la génération d'une image complètement nouvelle. Même si les invites utilisées pour créer l’image modifiée étaient extrêmement similaires à la première invite, en raison de la nature même de l’IA générative, le résultat pourrait être considérablement différent.
Les outils d'édition intégrés de DALL-E 3 visent désormais à résoudre les problèmes au sein de la même image sans créer de nouvelle invite. Vous mettez en surbrillance une zone de l'image que vous souhaitez ajuster, demandez à DALL-E d'effectuer une modification spécifique (telle que "supprimer ceci" ou "ajouter cette fonctionnalité"), et cela fonctionne.
Cependant, c'est un sac mélangé.
L'exemple du blog officiel d'OpenAI montre DALL-E ajoutant des fleurs de cerisier à une image de chat de style Ukiyo-e, et cela fonctionne parfaitement. D'après mon expérience, les outils d'édition de DALL-E ont du mal à ajouter des images aussi détaillées à une image existante et, pour la plupart, ne peuvent pas traiter les demandes de cette nature.
Cela ne veut pas dire que les outils d'édition ne fonctionnent pas. Ils peuvent absolument supprimer des fonctionnalités et apporter de petites modifications, comme détaillé ci-dessous, mais tout cela à petite échelle.
La meilleure façon de vous montrer ce que l'outil d'édition de DALL-E 3 peut faire est de donner quelques exemples appropriés.
Les outils d'édition du DALL-E 3 peuvent effacer certaines petites fonctionnalités, mais c'est vraiment difficile. Dans l'image suivante, j'avais demandé à DALL-E de créer "Une main robotique tenant une puce carrée transparente et lumineuse sur laquelle est écrit "AI Accelerated". Le fond est bleu foncé, créant une atmosphère futuriste et high-tech. "
Maintenant, étant donné que l'écriture de texte est un problème spécifique pour l'IA générative, je ne suis pas surpris que le texte soit faux. J'ai donc demandé à DALL-E de supprimer la faute d'orthographe. Il a échoué à la première tentative avec l'invite « supprimez ceci s'il vous plaît », mais a réussi au deuxième essai avec l'invite « s'il vous plaît, supprimez ce mot de l'image ». Donc, succès, oui, mais vous devrez peut-être essayer différentes invites pour obtenir un résultat. Je lui ai ensuite demandé de déplacer les lettres IA au centre du carré, ce qu'il a bien fait malgré le crash de mon PC pour une raison quelconque.
Ensuite, j'ai demandé à DALL-E de m'aider à éditer une image d'un téléviseur diffusant du statique. DALL-E est idéal pour générer des images uniques, mais certains détails sont erronés ou le texte est déformé. Dans ce cas, la barre d'informations sur l'écran du téléviseur affiche du texte AI charabia, j'ai donc voulu le supprimer. La première tentative de DALL-E a laissé une ombre à l'endroit où se trouvait la barre d'information, tandis que les deuxième et troisième tentatives étaient beaucoup plus nettes. Pas parfait, mais assez décent pour l’utilisation que j’en faisais.
DALL-E 3 peut apporter quelques modifications aux images, mais encore une fois, cela dépend de l'ampleur de ce que vous demandez. De petits ajouts et modifications sont possibles, mais la plupart du temps, l'outil d'édition de DALL-E ne peut pas traiter ce qui est demandé.
J'ai demandé à DALL-E de "créer une image 2:1 4k d'un œil humain en gros plan, avec des détails", ce qui donne l'image suivante :
Assez décent, bien qu'un peu étrange (reflets de cils ?!), mais je voulais plutôt changer la couleur de l'iris en bleu-vert, ce qui donne cette image :
La couleur est légèrement terne mais inchangée, et certains traits sont légèrement déformés.
Ensuite, j'ai incité DALL-E à "créer une image de style argile 4k 2:1 d'une personne portant une combinaison de tigre skiant sur une pente avec un fond de yéti".
Encore une fois, l'image originale est bonne, a des couleurs nettes et vibrantes et correspond à l'invite. Cependant, je voulais transformer le yéti en un autre type d'animal effrayant.
Au lieu d'échanger le yéti contre un autre animal, il a tout simplement complètement disparu. Au lieu de cela, je suis revenu à l’image originale et lui ai demandé d’ajouter un autre yéti, ce qu’il n’a pas fait. Il a également échoué lorsqu'on lui a demandé d'ajouter plus d'arbres à l'image.
Il n'y a pas grand chose à aborder ici. Comme nous l’avons dit, l’IA générative a généralement du mal avec le texte, et l’ajout de texte à une image est encore plus difficile. J'ai incité DALL-E à créer une carte postale d'un bord de mer britannique, ce qu'il a fait, capturant joliment la scène. J'ai ensuite voulu ajouter les mots « Sunny Beach » à l'image, ce qu'elle ne pouvait tout simplement pas gérer. Autrement dit, jusqu'à ce qu'après environ six ou sept allers-retours rappelant à DALL-E ce qu'il devait faire, il créait une toute nouvelle image avec le texte requis. Et un texte précis aussi ; Je ne suis pas sûr du visage du bébé au soleil, attention.
Ensuite, j'ai opté pour une carte d'anniversaire. Cette fois-ci, DALL-E a ajouté "Joyeux anniversaire" sans y être invité, ce qui est bien compte tenu du thème. Je lui ai donc demandé d'ajouter la date de l'anniversaire sur la carte. Encore une fois, il n'a pas réussi à ajouter la date à la carte, mais après quelques invites, il a créé une nouvelle image comportant la date demandée. Dans ce cas, ajouter moi-même la date aurait été plus simple, surtout si je souhaitais conserver l'image originale.
J'ai trouvé que les outils d'édition de DALL-E sont utiles pour certaines tâches, mais il faut un certain temps pour réussir l'édition. À d'autres moments, cela ne fonctionnera tout simplement pas, et vous feriez probablement mieux de reprendre votre invite d'origine et de la modifier pour créer une nouvelle image.
Les outils d'édition de DALL-E s'amélioreront probablement avec le temps, mais d'ici là, vous feriez peut-être mieux d'éditer votre image avec un outil d'édition d'image plutôt que de passer par plusieurs cycles de conversation fastidieux avec DALL-E. Quand ça marche, c'est bien ; quand il ne comprend pas ou ne fait pas du tout le montage, c'est frustrant.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!