DALL-E 3 の作成物をすぐに編集したいと思ったことはありますが、変更方法がわからなかったことがありますか?
OpenAI はあなたの声を聞き、ChatGPT の DALL-E 3 にインライン編集ツールを追加しました。これにより、アプリを離れることなく作成物を微調整できるようになりました。
唯一の問題は、OpenAI が宣伝していることを行っていないということであり、希望する編集が得られるかどうかについては賛否両論あります。しかし、それでも、これは DALL-E 3 編集の今後の始まりであり、これが DALL-E 3 編集の仕組みです。
かなり時間がかかりましたが、OpenAI はついに ChatGPT Plus の DALL-E 3 に編集機能を追加しました。これに先立って、DALL-E 3 の作成物を編集しようとすることはできましたが、通常は常に完全に新しいイメージが生成されてしまいます。編集された画像の作成に使用されたプロンプトが最初のプロンプトと非常に似ていたとしても、生成 AI の性質上、出力は大幅に異なる可能性があります。
DALL-E 3 の統合編集ツールは、新しいプロンプトを作成せずに同じ画像内の問題を修正することを目的としています。画像内の調整したい領域をハイライト表示し、DALL-E に特定の変更 (「これを削除」または「この機能を追加」など) を行うように指示すると、DALL-E が機能します。
ただし、それは賛否両論です。
OpenAI の公式ブログの例では、DALL-E が浮世絵風の猫の画像に桜の花を追加し、完璧に動作していることが示されています。私の経験では、DALL-E の編集ツールは、このような詳細な画像を既存の画像に追加するのに苦労しており、ほとんどの場合、この種のリクエストを処理できません。
編集ツールが機能しないというわけではありません。以下で詳しく説明するように、機能を削除したり、小さな変更を加えたりすることは完全に可能ですが、それはすべて小規模なものです。
DALL-E 3 の編集ツールで何ができるかを示す最良の方法は、適切な例をいくつか挙げることです。
DALL-E 3 の編集ツールはいくつかの小さな機能を消去できますが、間違いなく困難です。次の画像では、私が DALL-E に「『AI Accelerated』と書かれた輝く透明な四角いチップを持ったロボットハンド。背景はダークブルーで、未来的でハイテクな雰囲気を作り出しています。」の作成を依頼しました。
さて、テキストを書くことが生成 AI に特有の問題であることを考えると、テキストが間違っていたことには驚きません。そこで、DALL-E にスペルミスを削除するよう依頼しました。最初の試行では「この単語を削除してください」というプロンプトが表示されて失敗しましたが、2 回目の試行では「この単語を画像から削除してください」というプロンプトが表示されて成功しました。つまり、成功です。ただし、結果を得るには別のプロンプトを試行する必要がある場合があります。次に、AI 文字を正方形の中心に移動するように依頼しました。何らかの理由で PC がクラッシュしたにもかかわらず、うまく移動してくれました。
次に、私は DALL-E に、静止画を映しているテレビの画像編集を手伝ってくれるように頼みました。 DALL-E はユニークな画像を生成するのに最適ですが、一部の詳細が間違っていたり、歪んだテキストが表示されたりします。この場合、テレビ画面の情報バーに意味不明な AI テキストが表示されるため、それを削除したいと考えました。 DALL-E の最初の試行では、情報バーがあった場所に影が残りましたが、2 回目と 3 回目の試行でははるかにきれいになりました。完璧ではありませんが、画像を使用する目的には十分です。
DALL-E 3 は画像にいくつかの変更を加えることができますが、やはり、求めているものの規模によって異なります。小さな追加や変更は可能ですが、ほとんどの場合、DALL-E の編集ツールでは要求された内容を処理できません。
私は DALL-E に「人間の目をクローズアップし、詳細を示す 2:1 4K 画像を作成してください」と依頼し、次の画像が得られました:
少し奇妙ではあるものの (まつげの反射?!)、かなりまともです。しかし、代わりに虹彩の色を青緑に切り替えたかったので、次の画像が得られました:
色は少しくすんでいますが変化はなく、一部の機能はわずかに歪んでいます。
次に、私は DALL-E に、「イエティを背景に、タイガーの着ぐるみを着て斜面をスキーで滑り降りる人物の 4K 2:1 クレイメーション スタイルの画像を作成する」ように指示しました。
繰り返しますが、元の画像は良好で、シャープで鮮やかな色を持ち、プロンプトと一致しています。ただし、イエティを別の種類の恐ろしい動物に切り替えたかったのです。
イエティを別の動物と交換するのではなく、完全に消えてしまいます。代わりに、元のイメージに戻り、別のイエティを追加するように依頼しましたが、これは失敗しました。画像にさらに木を追加するように要求された場合も同様に失敗しました。
ここで説明する内容はあまりありません。前述のとおり、生成 AI は一般的にテキストに苦戦しており、画像にテキストを追加するのはさらに困難です。私は DALL-E に英国の海辺のポストカードを作成するよう促し、見事にその場面を捉えたポストカードを作成してくれました。次に、画像に「Sunny Beach」という単語を追加したいと思いましたが、それは処理できませんでした。つまり、DALL-E に何をする必要があるかを思い出させるプロンプトが 6 ~ 7 回前後繰り返されるまで、必要なテキストを含むまったく新しい画像が作成されました。そして正確なテキストも。太陽の光の下での赤ちゃんの顔についてはわかりません。
次に、バースデーカードを撮りに行きました。今回は、DALL-E がプロンプトなしで「ハッピーバースデー」を追加しましたが、テーマを考えると問題ありません。そこで、カードに誕生日の日付を入れてもらいました。ここでもカードに日付を追加できませんでしたが、数回のプロンプトの後、要求された日付を含む新しい画像が作成されました。この場合、特に元の画像を保持したい場合は、自分で日付を追加する方が簡単です。
DALL-E の編集ツールは特定のタスクには便利ですが、編集を正しく行うには時間がかかります。また、それが機能しない場合もあるので、元のプロンプトをそのまま使用し、それを微調整して新しいイメージを作成した方がよいでしょう。
DALL-E の編集ツールは時間の経過とともに改善される可能性がありますが、それまでは、DALL-E と何回も時間のかかる会話を行うよりも、画像編集ツールを使用して画像を編集する方が良いかもしれません。うまくいけば、それは良いことです。理解できなかったり、まったく編集できなかったりすると、イライラしてしまいます。
以上がDALL-E 3 には編集ツールが統合されましたが、作業が必要ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。