


Le MIT et Google recherchent conjointement la nouvelle technologie StableRep : utiliser des images synthétiques pour former des modèles d'images IA
L'accent est mis sur :
Des chercheurs ont proposé une nouvelle technologie appelée StableRep qui utilise des images générées par l'intelligence artificielle pour former des modèles d'images d'intelligence artificielle très détaillés
StableRep s'entraîne à l'aide de millions d'images synthétiques étiquetées, adopte une « méthode d'apprentissage à contrastes positifs multiples » pour améliorer le processus d'apprentissage et l'applique au modèle texte-image open source Stable Diffusion
- ⚙️ Bien que StableRep ait obtenu des résultats remarquables dans la classification ImageNet, il est lent à générer des images et il existe une inadéquation sémantique entre les astuces textuelles et les images générées.
Webmaster Home (ChinaZ.com) Actualités du 28 novembre : Des chercheurs du MIT et de Google ont récemment développé une nouvelle technologie appelée StableRep, qui vise à utiliser les images générées par l'IA pour former un modèle d'image d'IA plus détaillé et plus efficace. Cette technologie a été appliquée au modèle open source de conversion texte-image Stable Diffusion, réalisant une série de réalisations notables.
StableRep utilise une méthode unique appelée « méthode d'apprentissage à contraste positif multiple ». Dans cette approche, plusieurs images provenant de la même invite textuelle sont considérées comme des contrastes positifs les unes par rapport aux autres pour améliorer le processus d'apprentissage. Par exemple, pour l'invite de texte de paysage, le modèle comparera plusieurs images de paysage générées avec toutes les descriptions pertinentes pour trouver de petites différences basées sur ces images et les appliquera au résultat final, créant ainsi une image très détaillée
Les chercheurs notent que leur méthode excelle dans le traitement de plusieurs images comme des expressions de la même chose sous-jacente, plutôt que comme une simple collection de pixels. Des expériences ont prouvé que StableRep a atteint une précision linéaire de 76,7 % dans la tâche de classification ImageNet à l'aide du modèle Vision Transformer. De plus, en introduisant la supervision du langage, le modèle StableRep formé sur 20 millions d'images synthétiques a surpassé les performances du modèle CLIP formé sur 50 millions d'images réelles
Cependant, les générateurs stables ne sont pas sans défauts. Il génère des images lentement et souffre d'une inadéquation sémantique entre les invites textuelles et les images générées. De plus, la diffusion stable, le modèle sous-jacent du générateur stable, nécessite une formation initiale sur des données réelles, donc générer des images à l'aide du générateur stable prendra plus de temps et peut être plus coûteux
StableRep est open source sur GitHub et est disponible pour un usage commercial. Il adopte la licence Apache 2.0 et les utilisateurs peuvent l'utiliser et générer des œuvres dérivées, mais ils doivent fournir une copie de la licence Apache dans l'œuvre redistribuée ou l'œuvre dérivée et inclure un avis de modification. La licence inclut également une limitation de la responsabilité du contributeur pour tout dommage résultant de l'utilisation de l'œuvre sous licence. Stable Replica (StableRep) a été publié en open source sur GitHub et peut être utilisé à des fins commerciales. Il adopte la licence Apache2.0, qui permet aux utilisateurs d'utiliser et de créer des œuvres dérivées. Cependant, dans les redistributions ou les œuvres dérivées, les utilisateurs sont tenus de fournir une copie de la licence Apache et de notifier les modifications apportées. Cette licence indemnise également les contributeurs de tout préjudice causé par leur utilisation de l'œuvre sous licence
Ce résultat de recherche du MIT et de Google représente une innovation dans le domaine de la génération d'images par intelligence artificielle. Bien qu'il présente quelques défauts, il fournit une nouvelle méthode et une nouvelle idée pour générer des images de haute qualité
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Le protocole de contexte du modèle (MCP): un connecteur universel pour l'IA et les données Nous connaissons tous le rôle de l'IA dans le codage quotidien. Replit, GitHub Copilot, Black Box AI et Cursor IDE ne sont que quelques exemples de la façon dont AI rationalise nos flux de travail. Mais imaginez

Omniparser V2 et Omnitool de Microsoft: révolutionner l'automatisation de l'interface graphique avec l'IA Imaginez l'IA qui ne comprend pas seulement mais interagit également avec votre interface Windows 11 comme un professionnel chevronné. Omniparser v2 et omnitool de Microsoft en font un re

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Ce billet de blog partage mon expérience de l'outil d'animation ACT-One de Test Testing Runway ML, couvrant à la fois son interface Web et son API Python. Bien que prometteurs, mes résultats étaient moins impressionnants que prévu. Vous voulez explorer une IA générative? Apprenez à utiliser les LLMS dans P

Révolutionment du développement des applications: une plongée profonde dans l'agent de repelit Vous en avez assez de lutter avec des environnements de développement complexes et des fichiers de configuration obscurs? Replit Agent vise à simplifier le processus de transformation des idées en applications fonctionnelles. Cet ai-p

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Le projet de 500 milliards de dollars Stargate IA, soutenu par des géants de la technologie comme Openai, Softbank, Oracle et Nvidia, et soutenu par le gouvernement américain, vise à consolider la direction de l'IA américaine. Cette entreprise ambitieuse promet un avenir façonné par AI Advanceme
