Table des matières
Méthode
Modulation en cascade GAN​
Object Perception Training
Objectif d'entraînement avec régularisation Masked-R_1​
Expériences
Maison Périphériques technologiques IA Même si une grande partie de l'image manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Même si une grande partie de l'image manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Apr 08, 2023 pm 05:41 PM
图像 生成网络 修复

La restauration d'image consiste à compléter les zones manquantes de l'image, ce qui est l'une des tâches de base de la vision par ordinateur. Cette direction a de nombreuses applications pratiques, telles que la suppression d'objets, le reciblage d'images, la synthèse d'images, etc.

Les premières méthodes d'inpainting étaient basées sur la synthèse de blocs d'images ou la diffusion de couleurs pour combler les parties manquantes de l'image. Pour réaliser des structures d'images plus complexes, les chercheurs se tournent vers des approches basées sur les données, dans lesquelles ils utilisent des réseaux génératifs profonds pour prédire le contenu visuel et l'apparence. Grâce à un entraînement sur de grands ensembles d'images et à l'aide de la reconstruction et des pertes contradictoires, il a été démontré que les modèles d'inpainting génératifs produisent des résultats plus attrayants visuellement sur divers types de données d'entrée, notamment des images naturelles et des visages humains.

Cependant, les travaux existants ne peuvent donner de bons résultats que dans la réalisation de structures d'image simples, et générer du contenu d'image avec une structure globale complexe et des détails haute fidélité reste un énorme défi, surtout lorsque l'image a des trous lorsqu'elle est grande.

Essentiellement, l'inpainting d'images est confronté à deux problèmes clés : l'un est de savoir comment propager avec précision le contexte global à des régions incomplètes, et l'autre est de synthétiser de vrais détails locaux qui sont cohérents avec des indices globaux. Pour résoudre le problème de propagation du contexte global, les réseaux existants utilisent des structures de codeur-décodeur, des convolutions atreuses, une attention contextuelle ou des convolutions de Fourier pour intégrer des dépendances de fonctionnalités à longue portée et étendre le champ de réception efficace. De plus, l’approche en deux étapes et le remplissage itératif des trous reposent sur la prévision de résultats grossiers pour améliorer la structure globale. Cependant, ces modèles ne disposent pas d’un mécanisme permettant de capturer la sémantique de haut niveau des régions non masquées et de les propager efficacement dans des trous afin de synthétiser une structure globale globale.

Sur cette base, des chercheurs de l'Université de Rochester et Adobe Research ont proposé un nouveau réseau génératif : CM-GAN (cascaded modulation GAN), qui peut mieux synthétiser la structure globale et les détails locaux. CM-GAN comprend un encodeur avec des blocs de convolution de Fourier pour extraire des représentations de caractéristiques multi-échelles à partir d'images d'entrée avec des trous. Il existe également un décodeur à deux flux dans CM-GAN, qui définit un nouveau bloc de modulation spatiale globale en cascade à chaque couche d'échelle.

Dans chaque bloc de décodeur, nous appliquons d'abord une modulation globale pour effectuer une synthèse de structure grossière et sémantiquement consciente, puis effectuons une modulation spatiale pour ajuster davantage la carte des caractéristiques de manière spatialement adaptative. De plus, cette étude a conçu un programme de formation à la perception des objets pour éviter les artefacts dans la cavité afin de répondre aux besoins des tâches de suppression d'objets dans des scènes réelles. L'étude a mené des expériences approfondies pour montrer que CM-GAN surpasse considérablement les méthodes existantes en matière d'évaluations quantitatives et qualitatives.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

  • Adresse papier : https://arxiv.org/pdf/2203.11947.pdf
  • Adresse du projet : https://github.com/htzheng/CM-GAN-Inpainting

Regardons d'abord l'effet de réparation d'image. Par rapport à d'autres méthodes, CM-GAN peut reconstruire de meilleures textures :

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

CM-GAN peut synthétiser de meilleures structures globales :

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

CM-GAN a de meilleures limites d'objets :

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Jetons un coup d'œil à la méthode et aux résultats expérimentaux de cette étude.

Méthode

Modulation en cascade GAN​

Pour mieux modéliser le contexte global de complétion d'image, cette étude propose un nouveau mécanisme pour mettre en cascade la modulation de code globale avec la modulation de code spatial. Ce mécanisme permet de gérer des fonctionnalités partiellement invalides tout en mieux injectant un contexte global dans le domaine spatial. La nouvelle architecture CM-GAN peut bien synthétiser la structure globale et les détails locaux, comme le montre la figure 1 ci-dessous.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Comme le montre la figure 2 (à gauche) ci-dessous, CM-GAN est basé sur une branche d'encodeur et deux branches de décodeur en cascade parallèles pour générer une sortie visuelle. L'encodeur prend une partie de l'image et du masque en entrée et génère des cartes de caractéristiques multi-échelles Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture..

Contrairement à la plupart des méthodes d'encodeur-décodeur, afin de compléter la structure globale, cette étude extrait les codes de style globaux des fonctionnalités de plus haut niveau Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture. de la couche entièrement connectée puis effectue Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture. la normalisation. De plus, un réseau de cartographie basé sur MLP génère des codes de style w à partir du bruit pour simuler le caractère aléatoire de la génération d'images. Les codes w sont combinés avec s pour produire un code global g = [s; w], qui est utilisé dans les étapes de décodage ultérieures.

Modulation globale en cascade spatiale. Pour mieux connecter le contexte global lors de l’étape de décodage, cette étude propose une modulation spatiale globale en cascade (CM). Comme le montre la figure 2 (à droite), l'étape de décodage est basée sur deux branches : le bloc de modulation global (GB) et le bloc de modulation spatiale (SB), et suréchantillonne les caractéristiques globales F_g et les caractéristiques locales F_s en parallèle.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Contrairement aux méthodes existantes, CM-GAN introduit une nouvelle méthode d'injection de contexte global dans les régions de trous. Au niveau conceptuel, il consiste en des modulations globales et spatiales en cascade entre les caractéristiques à chaque échelle et intègre naturellement trois mécanismes de compensation pour la modélisation du contexte global : 1) le suréchantillonnage des caractéristiques ; 2) la modulation globale ;

Object Perception Training

L'algorithme qui génère des masques pour l'entraînement est crucial. Essentiellement, le masque échantillonné doit être similaire au masque dessiné dans le cas d'utilisation réel, et le masque doit éviter de couvrir la totalité de l'objet ou de grandes parties de tout nouvel objet. Des schémas de masquage trop simplistes peuvent conduire à des artefacts.

Pour mieux prendre en charge les cas d'utilisation réels de suppression d'objets tout en empêchant le modèle de synthétiser de nouveaux objets dans les trous, cette étude propose un schéma de formation à la sensibilisation aux objets qui génère des masques plus réalistes pendant la formation, comme indiqué ci-dessous 4.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Plus précisément, l'étude transmet d'abord les images d'entraînement au réseau de segmentation panoramique PanopticFCN pour générer des annotations de segmentation très précises au niveau de l'instance, puis échantillonne un mélange de trous libres et de trous d'objets comme masque initial, et enfin calculer le taux de chevauchement entre le trou et chaque instance de l'image. Si le taux de chevauchement est supérieur au seuil, la méthode exclut l'instance de premier plan du trou ; sinon, le trou reste inchangé et l'objet simulé est complété avec le seuil défini sur 0,5. L'étude s'étend et traduit de manière aléatoire les masques d'objets pour éviter le surajustement. De plus, cette étude agrandit les trous sur les limites de segmentation des instances pour éviter les fuites de pixels d'arrière-plan à proximité des trous dans la région peinte.

Objectif d'entraînement avec régularisation Masked-R_1​

Le modèle est entraîné avec une combinaison de perte contradictoire et de perte de perception basée sur la segmentation. Les expériences montrent que cette méthode peut également obtenir de bons résultats en utilisant uniquement des pertes adverses, mais l'ajout de pertes perceptuelles peut encore améliorer les performances.

De plus, cette étude propose une régularisation masquée-R_1 spécifiquement pour la formation contradictoire de tâches d'inpainting stables, où un masque m est utilisé pour éviter de calculer des pénalités de gradient en dehors du masque.

Expériences

Cette étude a mené des expériences d'inpainting d'images sur l'ensemble de données Places2 à une résolution de 512 × 512 et a présenté les résultats d'évaluation quantitative et qualitative du modèle.

Évaluation quantitative : Le tableau 1 ci-dessous montre la comparaison entre CM-GAN et d'autres méthodes de masquage. Les résultats montrent que CM-GAN surpasse considérablement les autres méthodes en termes de FID, LPIPS, U-IDS et P-IDS. Avec l'aide de la perte de perception, LaMa, CM-GAN obtient des scores LPIPS nettement meilleurs que CoModGAN et d'autres méthodes, grâce aux conseils sémantiques supplémentaires fournis par le modèle perceptuel pré-entraîné. Par rapport à LaMa/CoModGAN, CM-GAN réduit le FID de 3,864/3,724 à 1,628.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Comme le montre le tableau 3 ci-dessous, avec ou sans réglage fin, CM-GAN a obtenu des gains de performances nettement meilleurs que LaMa et CoModGAN sur les masques LaMa et CoModGAN, indiquant que le modèle a une capacité de généralisation. Il convient de noter que les performances du CM-GAN formé sur le masque CoModGAN, masque sensible aux objets, sont toujours meilleures que celles du masque CoModGAN, confirmant que CM-GAN a une meilleure capacité de génération.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Évaluation qualitative : Figure 5, Figure 6, Figure 8 montrent les résultats de la comparaison visuelle des méthodes CM-GAN et SOTA en termes de masques synthétiques. ProFill est capable de générer des structures globales incohérentes, CoModGAN produit des artefacts structurels et des taches de couleur, et LaMa est sujet à un flou d'image important sur les scènes naturelles. En revanche, la méthode CM-GAN produit une structure sémantique plus cohérente, une texture plus claire et peut être appliquée à différents scénarios.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Pour vérifier l'importance de chaque composant du modèle, l'étude a mené un ensemble d'expériences d'ablation, et tous les modèles ont été formés sur l'ensemble de données Places2 et évalués. . Les résultats de l'expérience d'ablation sont présentés dans le tableau 2 et la figure 7 ci-dessous.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

L'étude a également mené une étude utilisateur pour mieux évaluer la qualité de génération visuelle de la méthode CM-GAN, et les résultats sont présentés dans le tableau 5 ci-dessous. De plus, l'annexe fournit davantage de comparaisons visuelles et d'analyses expérimentales pour référence du lecteur.

Même si une grande partie de limage manque, elle peut être restaurée de manière réaliste. Le nouveau modèle CM-GAN prend en compte la structure globale et les détails de la texture.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Où trouver la courte de la grue à atomide atomique
1 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Cet identifiant Apple n'est pas encore utilisé dans l'iTunes Store : correctif Cet identifiant Apple n'est pas encore utilisé dans l'iTunes Store : correctif Jun 10, 2024 pm 05:42 PM

Lors de la connexion à iTunesStore à l'aide de l'AppleID, cette erreur indiquant "Cet AppleID n'a pas été utilisé dans iTunesStore" peut s'afficher à l'écran. Il n'y a pas de messages d'erreur à craindre, vous pouvez les corriger en suivant ces ensembles de solutions. Correctif 1 – Modifier l'adresse de livraison La principale raison pour laquelle cette invite apparaît dans l'iTunes Store est que vous n'avez pas la bonne adresse dans votre profil AppleID. Étape 1 – Tout d’abord, ouvrez les paramètres iPhone sur votre iPhone. Étape 2 – AppleID doit être au-dessus de tous les autres paramètres. Alors, ouvrez-le. Étape 3 – Une fois sur place, ouvrez l’option « Paiement et expédition ». Étape 4 – Vérifiez votre accès à l'aide de Face ID. étape

Comment réparer les yeux rouges sur iPhone Comment réparer les yeux rouges sur iPhone Feb 23, 2024 pm 04:31 PM

Vous avez donc pris de superbes photos lors de votre dernière fête, mais malheureusement, la plupart des photos que vous avez prises étaient des yeux rouges. La photo elle-même est superbe, mais les yeux rouges gâchent en quelque sorte l'image. Sans oublier que certaines de ces photos de fête peuvent provenir des téléphones de vos amis. Aujourd'hui, nous verrons comment supprimer les yeux rouges des photos. Quelle est la cause des yeux rouges sur la photo ? Les yeux rouges surviennent souvent lors de la prise de photos avec flash. En effet, la lumière du flash brille directement à l'arrière de l'œil, ce qui fait que les vaisseaux sanguins sous l'œil réfléchissent la lumière, donnant l'effet d'yeux rouges sur la photo. Heureusement, grâce aux progrès continus de la technologie, certains appareils photo sont désormais équipés de fonctions de correction des yeux rouges qui peuvent résoudre efficacement ce problème. En utilisant cette fonctionnalité, l'appareil photo prend des photos

Comment résoudre le problème de l'échec de Win11 à vérifier les informations d'identification ? Comment résoudre le problème de l'échec de Win11 à vérifier les informations d'identification ? Jan 30, 2024 pm 02:03 PM

Lorsque certains utilisateurs Win11 se connectent à l'aide de leurs informations d'identification, ils reçoivent un message d'erreur indiquant que vos informations d'identification ne peuvent pas être vérifiées. Que se passe-t-il ? Après que l'éditeur ait étudié ce problème, j'ai découvert qu'il pouvait y avoir plusieurs situations différentes qui causaient directement ou indirectement ce problème. Jetons un coup d'œil avec l'éditeur.

Un guide simple pour résoudre les problèmes d'écran bleu de Windows 11 Un guide simple pour résoudre les problèmes d'écran bleu de Windows 11 Dec 27, 2023 pm 02:26 PM

De nombreux amis rencontrent toujours des écrans bleus lorsqu'ils utilisent des systèmes d'exploitation informatiques. Même le dernier système Win11 ne peut pas échapper au sort des écrans bleus. Par conséquent, je vous propose aujourd'hui un tutoriel sur la façon de réparer les écrans bleus Win11. Que vous ayez rencontré ou non un écran bleu, vous pouvez d'abord l'apprendre au cas où vous en auriez besoin. Comment réparer la méthode de l'écran bleu Win11 1. Si nous rencontrons un écran bleu, redémarrez d'abord le système et vérifiez s'il peut démarrer normalement. 2. S'il peut démarrer normalement, cliquez avec le bouton droit sur "Ordinateur" sur le bureau et sélectionnez "Gérer". 3. Développez ensuite "Outils système" sur le côté gauche de la fenêtre contextuelle et sélectionnez "Observateur d'événements". 4. Dans le Observateur d'événements, nous verrons quel problème spécifique a causé l'écran bleu. 5. Ensuite, suivez simplement la situation et les événements sur l'écran bleu

Mar 22, 2024 pm 12:45 PM

Un guide complet des erreurs PHP500 : causes, diagnostics et correctifs Au cours du développement PHP, nous rencontrons souvent des erreurs avec le code d'état HTTP 500. Cette erreur est généralement appelée « 500InternalServerError », ce qui signifie que des erreurs inconnues se sont produites lors du traitement de la requête côté serveur. Dans cet article, nous explorerons les causes courantes des erreurs PHP500, comment les diagnostiquer et comment les corriger, et fournirons des exemples de code spécifiques pour référence. Causes courantes des erreurs 1.500 1.

Comment réparer le volume ne peut pas être ajusté dans WIN10 Comment réparer le volume ne peut pas être ajusté dans WIN10 Mar 27, 2024 pm 05:16 PM

1. Appuyez sur win+r pour ouvrir la fenêtre d'exécution, entrez [regedit] et appuyez sur Entrée pour ouvrir l'éditeur de registre. 2. Dans l'éditeur de registre ouvert, cliquez pour développer [HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionRun]. Dans l'espace vide à droite, cliquez avec le bouton droit et sélectionnez [Nouveau - Valeur de chaîne], puis renommez-le en [systray.exe]. 3. Double-cliquez pour ouvrir systray.exe, modifiez ses données numériques en [C:WindowsSystem32systray.exe] et cliquez sur [OK] pour enregistrer les paramètres.

Comment résoudre le problème d'écran bleu causé par csrss.exe Comment résoudre le problème d'écran bleu causé par csrss.exe Dec 28, 2023 pm 06:24 PM

Si votre ordinateur affiche souvent un écran bleu après le démarrage, cela peut être dû à une erreur grave (code d'arrêt 0xF4) provoquée par le système Windows dans le fichier csrss.exe. Voyons maintenant comment y remédier ! Comment réparer l'écran bleu csrss.exe. Tout d'abord, appuyez simultanément sur les touches "Ctrl+Alt+Suppr". À ce moment, l'interface du Gestionnaire des tâches de Microsoft Windows apparaîtra. Cliquez sur l'onglet "Gestionnaire des tâches" et l'écran répertoriera tous les programmes en cours d'exécution et les ressources qu'ils occupent ainsi que d'autres informations. Cliquez à nouveau pour accéder à l'onglet « Processus », cliquez à nouveau sur « Nom de l'image », puis recherchez le fichier « csrss.exe » dans la liste. Cliquez sur le bouton « Terminer le processus »

Comment résoudre le problème de l'impossibilité d'accéder à Internet en raison d'un pilote de carte réseau anormal Comment résoudre le problème de l'impossibilité d'accéder à Internet en raison d'un pilote de carte réseau anormal Jan 06, 2024 pm 06:33 PM

Certains amis constatent que leurs ordinateurs ne peuvent pas accéder à Internet à cause de pilotes de carte réseau anormaux. Ils veulent savoir comment résoudre ce problème. En fait, les systèmes actuels ont des fonctions de réparation de pilotes intégrées, nous n'avons donc besoin que de mettre à jour manuellement le pilote. cela ne fonctionne pas, alors nous pouvons le réparer. Le logiciel pilote peut être utilisé. Comment résoudre le problème selon lequel le pilote de la carte réseau est anormal et ne peut pas se connecter à Internet : PS : si ce problème survient soudainement, vous pouvez d'abord essayer de redémarrer l'ordinateur. Si cela ne fonctionne toujours pas après le redémarrage, poursuivez les opérations suivantes. . Méthode 1 : 1. Tout d'abord, faites un clic droit sur la barre des tâches et sélectionnez « Menu Démarrer ». 2. Ouvrez « Gestionnaire de périphériques » dans le menu contextuel. 3. Cliquez sur « Adaptateur réseau », puis sélectionnez « Mettre à jour le pilote » et cliquez sur « Rechercher automatiquement le pilote ». Une fois la mise à jour terminée, vous pouvez surfer sur Internet normalement. 5. Certains utilisateurs sont également concernés par le problème.

See all articles