Maison Périphériques technologiques IA Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles d'images IA

Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles d'images IA

Nov 29, 2023 am 11:17 AM
合成图像 stablerep modèle d'image IA

L'accent est mis sur :

Des chercheurs ont proposé une nouvelle technologie appelée StableRep qui utilise des images générées par l'intelligence artificielle pour former des modèles d'images d'intelligence artificielle très détaillés

StableRep s'entraîne à l'aide de millions d'images synthétiques étiquetées, adopte une « méthode d'apprentissage à contrastes positifs multiples » pour améliorer le processus d'apprentissage et l'applique au modèle texte-image open source Stable Diffusion

- ⚙️ Bien que StableRep ait obtenu des résultats remarquables dans la classification ImageNet, il est lent à générer des images et il existe une inadéquation sémantique entre les astuces textuelles et les images générées.

Webmaster Home (ChinaZ.com) Actualités du 28 novembre : Des chercheurs du MIT et de Google ont récemment développé une nouvelle technologie appelée StableRep, qui vise à utiliser les images générées par l'IA pour former un modèle d'image d'IA plus détaillé et plus efficace. Cette technologie a été appliquée au modèle open source de conversion texte-image Stable Diffusion, réalisant une série de réalisations notables.

StableRep utilise une méthode unique appelée « méthode d'apprentissage à contraste positif multiple ». Dans cette approche, plusieurs images provenant de la même invite textuelle sont considérées comme des contrastes positifs les unes par rapport aux autres pour améliorer le processus d'apprentissage. Par exemple, pour l'invite de texte de paysage, le modèle comparera plusieurs images de paysage générées avec toutes les descriptions pertinentes pour trouver de petites différences basées sur ces images et les appliquera au résultat final, créant ainsi une image très détaillée

Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles dimages IA

Les chercheurs notent que leur méthode excelle dans le traitement de plusieurs images comme des expressions de la même chose sous-jacente, plutôt que comme une simple collection de pixels. Des expériences ont prouvé que StableRep a atteint une précision linéaire de 76,7 % dans la tâche de classification ImageNet à l'aide du modèle Vision Transformer. De plus, en introduisant la supervision du langage, le modèle StableRep formé sur 20 millions d'images synthétiques a surpassé les performances du modèle CLIP formé sur 50 millions d'images réelles

Cependant, les générateurs stables ne sont pas sans défauts. Il génère des images lentement et souffre d'une inadéquation sémantique entre les invites textuelles et les images générées. De plus, la diffusion stable, le modèle sous-jacent du générateur stable, nécessite une formation initiale sur des données réelles, donc générer des images à l'aide du générateur stable prendra plus de temps et peut être plus coûteux

StableRep est open source sur GitHub et est disponible pour un usage commercial. Il adopte la licence Apache 2.0 et les utilisateurs peuvent l'utiliser et générer des œuvres dérivées, mais ils doivent fournir une copie de la licence Apache dans l'œuvre redistribuée ou l'œuvre dérivée et inclure un avis de modification. La licence inclut également une limitation de la responsabilité du contributeur pour tout dommage résultant de l'utilisation de l'œuvre sous licence. Stable Replica (StableRep) a été publié en open source sur GitHub et peut être utilisé à des fins commerciales. Il adopte la licence Apache2.0, qui permet aux utilisateurs d'utiliser et de créer des œuvres dérivées. Cependant, dans les redistributions ou les œuvres dérivées, les utilisateurs sont tenus de fournir une copie de la licence Apache et de notifier les modifications apportées. Cette licence indemnise également les contributeurs de tout préjudice causé par leur utilisation de l'œuvre sous licence

Ce résultat de recherche du MIT et de Google représente une innovation dans le domaine de la génération d'images par intelligence artificielle. Bien qu'il présente quelques défauts, il fournit une nouvelle méthode et une nouvelle idée pour générer des images de haute qualité

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Apr 02, 2025 pm 06:10 PM

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

Chatgpt 4 o est-il disponible? Chatgpt 4 o est-il disponible? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

Début avec Meta Llama 3.2 - Analytics Vidhya Début avec Meta Llama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

META'S LLAMA 3.2: un bond en avant dans l'IA multimodal et mobile Meta a récemment dévoilé Llama 3.2, une progression importante de l'IA avec de puissantes capacités de vision et des modèles de texte légers optimisés pour les appareils mobiles. S'appuyer sur le succès o

Meilleurs chatbots AI comparés (Chatgpt, Gemini, Claude & amp; plus) Meilleurs chatbots AI comparés (Chatgpt, Gemini, Claude & amp; plus) Apr 02, 2025 pm 06:09 PM

L'article compare les meilleurs chatbots d'IA comme Chatgpt, Gemini et Claude, en se concentrant sur leurs fonctionnalités uniques, leurs options de personnalisation et leurs performances dans le traitement et la fiabilité du langage naturel.

Assistants d'écriture de l'IA pour augmenter votre création de contenu Assistants d'écriture de l'IA pour augmenter votre création de contenu Apr 02, 2025 pm 06:11 PM

L'article traite des meilleurs assistants d'écriture d'IA comme Grammarly, Jasper, Copy.ai, WireSonic et Rytr, en se concentrant sur leurs fonctionnalités uniques pour la création de contenu. Il soutient que Jasper excelle dans l'optimisation du référencement, tandis que les outils d'IA aident à maintenir le ton

Comment accéder à Falcon 3? - Analytique Vidhya Comment accéder à Falcon 3? - Analytique Vidhya Mar 31, 2025 pm 04:41 PM

Falcon 3: un modèle révolutionnaire de grande langue open source Falcon 3, la dernière itération de la célèbre série Falcon de LLMS, représente une progression importante de la technologie de l'IA. Développé par le Technology Innovation Institute (TII), cet ouvert

Choisir le meilleur générateur de voix d'IA: les meilleures options examinées Choisir le meilleur générateur de voix d'IA: les meilleures options examinées Apr 02, 2025 pm 06:12 PM

L'article examine les meilleurs générateurs de voix d'IA comme Google Cloud, Amazon Polly, Microsoft Azure, IBM Watson et Descript, en se concentrant sur leurs fonctionnalités, leur qualité vocale et leur aptitude à différents besoins.

Top 7 Système de chiffon agentique pour construire des agents d'IA Top 7 Système de chiffon agentique pour construire des agents d'IA Mar 31, 2025 pm 04:25 PM

2024 a été témoin d'un simple passage de l'utilisation des LLM pour la génération de contenu pour comprendre leur fonctionnement intérieur. Cette exploration a conduit à la découverte des agents de l'IA - les systèmes autonomes manipulant des tâches et des décisions avec une intervention humaine minimale. Construire

See all articles