ニュース 米国現地時間3月22日火曜日、Microsoftはテキストの説明に基づいて対応する画像を生成できるAI画像生成機能をBing検索とブラウザEdgeに追加すると発表した。
この新機能は Image Creator と呼ばれ、OpenAI の生成画像ジェネレーター DALL-E を利用しています。ただし、Microsoftは使用しているDALL-Eのバージョンを明らかにせず、「DALL-Eモデルの最新バージョン」とだけ呼んでいる。
Image Creator は現在、Bing プレビューでユーザーに公開されており、Bing のクリエイティブ モードでのみ利用できます。将来的には、この機能は Bing の Balanced Mode と Precise Mode にも拡張される予定です。
同時に、新しい画像ジェネレーターも Edge サイドバーに表示され、ユーザーはテキスト入力プロンプトを使用して画像を作成できるようになります。 Microsoft によれば、今後、Image Creator はさらに多くの言語サポートを追加する予定です。
テキスト プロンプトに従って、Image Creator は 4 つの高解像度 DALL-E 画像で構成される正方形を生成します。 「また、Image Creator の画像は AI によって生成されており、各画像の左下隅には修正された Bing アイコンが含まれていることも明確にしました」と Microsoft 副社長の Yusuf Mehdi 氏は述べています。 ."
Microsoft は、AI によるテキストから画像への変換機能をすぐに Bing に導入しましたが、これにより、検索エンジンによって生成される画像が粗悪になる可能性があります。専門家らは、テキストから画像への変換システムによって生成された画像がプロパガンダ、嫌がらせ、偽情報などに使用される可能性があると警告している。
これに関して、Microsoft は次のように説明しました。「悪用を防ぐために、OpenAI 保護対策を導入し、Image Creator に追加の保護を追加しました。たとえば、イメージ生成のための有害または安全でないコントロールを制限するように設計された対策を実装しました。プロンプトが潜在的に有害な画像の生成につながる可能性があることをシステムが検出すると、プロンプトがブロックされ、ユーザーに警告が表示されます。」
Microsoft は、画像ジェネレーターの更新を継続的に行うと述べました。具体的には、Microsoft は、マルチラウンド チャットにおける Image Creator の動作方法の最適化に取り組んでいることを強調しました。同社は次のように投稿しました。「これらのテクノロジーを市場に投入する最善の方法は、誰もがフィードバックできるように公共の場で慎重にテストすることであると信じ続けています。」
新しい画像ジェネレーターに加えて、Bingには、ビジュアル ストーリーとナレッジ カード 2.0 という 2 つの新しい検索機能も追加されています。 Bing の以前のバージョンでは、これらのナレッジ カードは Google のナレッジ パネルに似ていましたが、現在では、AI によって生成されたインフォグラフィックスや、よりインタラクティブなコンテンツ (グラフやタイムラインなど) などの新しい要素が追加されています。 一方、ビジュアルストーリー機能は、Instagram ストーリーの AI 生成バージョンに似ています。これらの機能は一部のユーザーの検索で頻繁に表示されるため、Microsoft はここ数週間でこれらの機能をテストしていると報告されています。ストーリーには、トピックに応じて AI が生成した音声ナレーションが付いています。場合によっては、検索結果の上部に表示されたり、ナレッジ カードに表示されたりすることがあります。
たとえば、「オレゴン州ポートランド」を検索すると、Bing は「ポートランドで菌類を見つける方法」や「ポートランド: アメリカで最も奇妙な都市」のストーリーなどの用語を強調表示します。残念ながら、これらのストーリーに直接リンクする方法はないようです。 (シャオシャオ)
以上がMicrosoft Bing、OpenAIテクノロジーを活用したAI描画機能を開始の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。