Maison Périphériques technologiques IA Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles d'images IA

Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles d'images IA

Nov 29, 2023 am 11:17 AM
合成图像 stablerep modèle d'image IA

L'accent est mis sur :

Des chercheurs ont proposé une nouvelle technologie appelée StableRep qui utilise des images générées par l'intelligence artificielle pour former des modèles d'images d'intelligence artificielle très détaillés

StableRep s'entraîne à l'aide de millions d'images synthétiques étiquetées, adopte une « méthode d'apprentissage à contrastes positifs multiples » pour améliorer le processus d'apprentissage et l'applique au modèle texte-image open source Stable Diffusion

- ⚙️ Bien que StableRep ait obtenu des résultats remarquables dans la classification ImageNet, il est lent à générer des images et il existe une inadéquation sémantique entre les astuces textuelles et les images générées.

Webmaster Home (ChinaZ.com) Actualités du 28 novembre : Des chercheurs du MIT et de Google ont récemment développé une nouvelle technologie appelée StableRep, qui vise à utiliser les images générées par l'IA pour former un modèle d'image d'IA plus détaillé et plus efficace. Cette technologie a été appliquée au modèle open source de conversion texte-image Stable Diffusion, réalisant une série de réalisations notables.

StableRep utilise une méthode unique appelée « méthode d'apprentissage à contraste positif multiple ». Dans cette approche, plusieurs images provenant de la même invite textuelle sont considérées comme des contrastes positifs les unes par rapport aux autres pour améliorer le processus d'apprentissage. Par exemple, pour l'invite de texte de paysage, le modèle comparera plusieurs images de paysage générées avec toutes les descriptions pertinentes pour trouver de petites différences basées sur ces images et les appliquera au résultat final, créant ainsi une image très détaillée

Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles dimages IA

Les chercheurs notent que leur méthode excelle dans le traitement de plusieurs images comme des expressions de la même chose sous-jacente, plutôt que comme une simple collection de pixels. Des expériences ont prouvé que StableRep a atteint une précision linéaire de 76,7 % dans la tâche de classification ImageNet à l'aide du modèle Vision Transformer. De plus, en introduisant la supervision du langage, le modèle StableRep formé sur 20 millions d'images synthétiques a surpassé les performances du modèle CLIP formé sur 50 millions d'images réelles

Cependant, les générateurs stables ne sont pas sans défauts. Il génère des images lentement et souffre d'une inadéquation sémantique entre les invites textuelles et les images générées. De plus, la diffusion stable, le modèle sous-jacent du générateur stable, nécessite une formation initiale sur des données réelles, donc générer des images à l'aide du générateur stable prendra plus de temps et peut être plus coûteux

StableRep est open source sur GitHub et est disponible pour un usage commercial. Il adopte la licence Apache 2.0 et les utilisateurs peuvent l'utiliser et générer des œuvres dérivées, mais ils doivent fournir une copie de la licence Apache dans l'œuvre redistribuée ou l'œuvre dérivée et inclure un avis de modification. La licence inclut également une limitation de la responsabilité du contributeur pour tout dommage résultant de l'utilisation de l'œuvre sous licence. Stable Replica (StableRep) a été publié en open source sur GitHub et peut être utilisé à des fins commerciales. Il adopte la licence Apache2.0, qui permet aux utilisateurs d'utiliser et de créer des œuvres dérivées. Cependant, dans les redistributions ou les œuvres dérivées, les utilisateurs sont tenus de fournir une copie de la licence Apache et de notifier les modifications apportées. Cette licence indemnise également les contributeurs de tout préjudice causé par leur utilisation de l'œuvre sous licence

Ce résultat de recherche du MIT et de Google représente une innovation dans le domaine de la génération d'images par intelligence artificielle. Bien qu'il présente quelques défauts, il fournit une nouvelle méthode et une nouvelle idée pour générer des images de haute qualité

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Qu'est-ce que le protocole de contexte modèle (MCP)? Qu'est-ce que le protocole de contexte modèle (MCP)? Mar 03, 2025 pm 07:09 PM

Le protocole de contexte du modèle (MCP): un connecteur universel pour l'IA et les données Nous connaissons tous le rôle de l'IA dans le codage quotidien. Replit, GitHub Copilot, Black Box AI et Cursor IDE ne sont que quelques exemples de la façon dont AI rationalise nos flux de travail. Mais imaginez

Construire un agent de vision local utilisant omniparser v2 et omnitool Construire un agent de vision local utilisant omniparser v2 et omnitool Mar 03, 2025 pm 07:08 PM

Omniparser V2 et Omnitool de Microsoft: révolutionner l'automatisation de l'interface graphique avec l'IA Imaginez l'IA qui ne comprend pas seulement mais interagit également avec votre interface Windows 11 comme un professionnel chevronné. Omniparser v2 et omnitool de Microsoft en font un re

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Guide de la piste ACT-ONE: Je me suis filmé pour le tester Guide de la piste ACT-ONE: Je me suis filmé pour le tester Mar 03, 2025 am 09:42 AM

Ce billet de blog partage mon expérience de l'outil d'animation ACT-One de Test Testing Runway ML, couvrant à la fois son interface Web et son API Python. Bien que prometteurs, mes résultats étaient moins impressionnants que prévu. Vous voulez explorer une IA générative? Apprenez à utiliser les LLMS dans P

Replit Agent: un guide avec des exemples pratiques Replit Agent: un guide avec des exemples pratiques Mar 04, 2025 am 10:52 AM

Révolutionment du développement des applications: une plongée profonde dans l'agent de repelit Vous en avez assez de lutter avec des environnements de développement complexes et des fichiers de configuration obscurs? Replit Agent vise à simplifier le processus de transformation des idées en applications fonctionnelles. Cet ai-p

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Elon Musk et Sam Altman s'affrontent plus de 500 milliards de dollars Stargate Project Elon Musk et Sam Altman s'affrontent plus de 500 milliards de dollars Stargate Project Mar 08, 2025 am 11:15 AM

Le projet de 500 milliards de dollars Stargate IA, soutenu par des géants de la technologie comme Openai, Softbank, Oracle et Nvidia, et soutenu par le gouvernement américain, vise à consolider la direction de l'IA américaine. Cette entreprise ambitieuse promet un avenir façonné par AI Advanceme

See all articles