Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成-AI-php.cn

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

PHPz

リリース： 2023-03-31 22:39:19

転載

1673 人が閲覧しました

Microsoft Bing は、テキストから画像を生成する機能を向上させました。また、Adobe も本日、生成 AI ゲームに参入するために Firefly をリリースしました。

昨夜はとても賑やかでした。

Nvidia GTC が進行中である一方で、Google は Bard のテストを正式にオープンしており、Microsoft Bing はここで孤独になるつもりはありません。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

本日、Microsoft は、Bing 検索エンジンが OpenAI の DALL·E モデルにアクセスし、AI 生成画像の機能を追加したことを正式に発表しました。

言い換えれば、ChatGPT にアクセスした後、Bing は Bing Image Creator を再度強化し、ユーザーが DALL·E モデルを使用して画像を生成できるようにしました。

「Bing プレビューアクセス権を持つユーザーの場合、Bing Image Creator は Bing チャットエクスペリエンスに完全に統合され、最初はクリエイティブモードで起動されます。」と Microsoft の消費者マーケティング責任者の Yusuf Mehdi 氏は説明しました。「画像の説明を入力し、場所やアクティビティなどの追加のコンテキストを提供し、アートスタイルを選択すると、Image Creator はユーザーの想像力に基づいて画像を生成します。」

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

# # Bing には、クリエイティブモード、バランスモード、精密モードの 3 つの応答モードがあります。 Creative モードの Bing によって生成される結果は通常「独創的で想像力豊か」ですが、Precise モードでは正確さと関連性が重視され、より真実で簡潔な回答が得られます。現在、Image Creator はクリエイティブモードでのみ使用できます。

Bing プレビューバージョンにアクセスできない場合でも、ユーザーは bing.com/create に直接アクセスすることで Image Creator だけを使用して画像生成機能を試すことができることに注意してください。現在は英語のみです。入力がサポートされています。 Microsoft は、今後さらに多くの言語入力をサポートすると述べています。

さらに、Microsoft は、新しい AI を活用したビジュアルストーリー (ビジュアルストーリー) と Knowledge Cards 2.0 を Bing でリリースしました。

OpenAI テキスト生成画像に関する DALL・E シリーズの研究を簡単に紹介します。

2021 年 1 月 6 日、OpenAI ブログは、テキストと画像を接続する 2 つのニューラルネットワーク、DALL・E と CLIP をリリースしました。 DALL・Eはテキストに基づいて画像を直接生成できますが、CLIPは画像とテキストのカテゴリのマッチングを完了できます。これら 2 つの研究結果の発表は、コミュニティに大きな懸念を引き起こしました。

ブログによれば、DALL・E は自然言語で表現された多数の概念を適切な画像に変換することができ、GPT-3 の 120 億パラメータ版とも言えるものです。テキストの説明に基づいて画像を生成します。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

DALL・E 例。「アボカドの形をした椅子」という文を考えると、さまざまな形の緑色のアボカド椅子の画像が得られます。

2 か月後、DALL・E の論文とコードが公開されました。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

プロジェクトアドレス: https://github.com/openai/DALL-E
論文アドレス: https://arxiv.org/ abs/2102.12092

2022 年 4 月 7 日頃、DALL・E はアップグレードされたバージョン、DALL・E 2 を発表しました。 DALL・E と比較して、DALL・E 2 は解像度が高く、ユーザー記述画像を生成する際の遅延が短くなります。さらに新バージョンでは、オリジナル画像の編集などの新機能も追加されている。

OpenAI は、DALL・E 2 の研究論文「CLIP Latents を使用した階層的テキスト条件付き画像生成」も発表しました。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成