Microsoft Bing a amélioré sa capacité à générer des images à partir de texte, et Adobe a également publié Firefly aujourd'hui pour entrer dans le jeu de l'IA générative.
C'était vraiment animé hier soir.
Alors que Nvidia GTC est en cours, Google a officiellement ouvert le test de Bard, et Microsoft Bing n'est pas seul ici.
Aujourd'hui, Microsoft a officiellement annoncé que le moteur de recherche Bing a intégré le modèle DALL·E d'OpenAI, ajoutant la fonction d'images générées par l'IA.
En d'autres termes, après avoir accédé à ChatGPT, Bing a encore une fois amélioré son Bing Image Creator pour permettre aux utilisateurs de générer des images à l'aide du modèle DALL·E.
"Pour les utilisateurs disposant d'un accès à Bing Preview, Bing Image Creator sera entièrement intégré à l'expérience de chat Bing, lancé d'abord en mode créatif", a expliqué Yusuf Mehdi, responsable du marketing grand public chez Microsoft. "En saisissant une description de l'image, en fournissant un contexte supplémentaire tel que le lieu ou l'activité, et en sélectionnant un style artistique, Image Creator générera des images basées sur l'imagination de l'utilisateur."
Bing dispose de trois modes de réponse : le mode créatif, mode équilibré et mode précis. Les résultats générés par Bing en mode Créatif sont généralement « originaux et imaginatifs », tandis que le mode Précis privilégie l'exactitude et la pertinence pour des réponses plus véridiques et concises. Actuellement, Image Creator ne peut être utilisé qu'en mode créatif.
Il convient de mentionner que même si vous n'avez pas accès à la version d'aperçu de Bing, les utilisateurs peuvent toujours utiliser Image Creator seul pour essayer sa fonction de génération d'images en accédant directement à bing.com/create Actuellement, seule la saisie en anglais est prise en charge. Microsoft affirme qu'il prendra en charge davantage de saisie de langues au fil du temps.
De plus, Microsoft a lancé de nouvelles histoires visuelles et cartes de connaissances 2.0 basées sur l'IA dans Bing.
Nous vous présentons brièvement la série de recherches DALL·E sur les images générées par texte OpenAI.
Le 6 janvier 2021, le blog OpenAI a publié deux réseaux de neurones qui connectent le texte et les images : DALL・E et CLIP. DALL・E peut générer directement des images basées sur du texte, tandis que CLIP peut compléter la correspondance des catégories d'images et de texte. La publication de ces deux études a suscité une grande inquiétude dans la communauté.
Selon le blog, DALL・E peut convertir un grand nombre de concepts exprimés sous forme de langage naturel en images appropriées. On peut dire qu'il s'agit de la version à 12 milliards de paramètres de GPT-3, qui peut générer des images basées sur. descriptions de texte.
DALL・E Exemple. Étant donné la phrase « chaise en forme d'avocat », vous pouvez obtenir des images de chaises en avocat vert de différentes formes.
2 mois plus tard, les papiers et le code de DALL·E ont été rendus publics.
Vers le 7 avril 2022, DALL・E a inauguré une version améliorée - DALL・E 2. Comparé à DALL・E, DALL・E 2 a une résolution plus élevée et une latence plus faible pour générer des images décrites par l'utilisateur. De plus, la nouvelle version ajoute également de nouvelles fonctionnalités, telles que l'édition d'images originales.
OpenAI a également annoncé le document de recherche de DALL・E 2 "Hierarchical Text-Conditional Image Generation with CLIP Latents".
Adresse papier : https://cdn.openai.com/papers/dall-e-2.pdf
Le DALL・E consulté par Bing cette fois aurait dû être mis à jour et itéré. Dans une certaine mesure, cela compense le manque d’expérience actuel de ChatGPT en matière de génération multimodale. Cependant, lorsque les capacités multimodales de GPT-4 seront ouvertes, cela pourrait nous apporter davantage de nouvelles expériences.
Enfin, une autre IA générative publiée aujourd'hui a attiré l'attention et les discussions parmi les acteurs de l'industrie.
C'est à ce moment-là qu'Adobe lance Firefly. Il s'agit d'une série de modèles d'IA génératifs pour l'expression créative qui permettent aux utilisateurs de modifier rapidement des images en tapant des commandes. Actuellement, Firefly a ouvert une version bêta et les lecteurs intéressés peuvent postuler pour en faire l'expérience.
De nos jours, il semble que de plus en plus de joueurs se lancent dans le jeu de l'IA générative, et la concurrence devient de plus en plus féroce.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!