Maison Périphériques technologiques IA Article très bien noté CVPR 2024 : Nouveau cadre d'édition générative GenN2N, unifiant les tâches de conversion NeRF

Article très bien noté CVPR 2024 : Nouveau cadre d'édition générative GenN2N, unifiant les tâches de conversion NeRF

Apr 19, 2024 pm 09:40 PM
git 工程 genn2n

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

La rubrique AIxiv de notre site Web est une rubrique sur le contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de notre site Web a reçu plus de 2 000 contenus, couvrant les meilleurs laboratoires de grandes universités et entreprises du monde entier, contribuant ainsi à promouvoir les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. L'adresse e-mail de soumission est liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com.


Des chercheurs de l'Université des sciences et technologies de Hong Kong et de l'Université Tsinghua ont proposé "GenN2N", un cadre de conversion génératif unifié NeRF en NeRF adapté à diverses tâches de conversion NeRF, telles que l'édition NeRF pilotée par texte, l'ombrage , super-résolution, réparation, etc., les performances sont extrêmement bonnes ! CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

  • Adresse papier : https://arxiv.org/abs/2404.02788
  • Page d'accueil papier : https://xiangyueliu.github.io/GenN2N/
  • Git Adresse du hub : https://github.com/Lxiangyue/GenN2N
  • Titre de l'article : GenN2N : Generative NeRF2NeRF Translation

Ces dernières années, les champs de rayonnement neuronal (NeRF) ont attiré beaucoup d'attention en raison de leur compacité , de haute qualité et de polyvalence. Les domaines de la reconstruction 3D, de la génération 3D et de la synthèse de nouvelles perspectives ont attiré une large attention. Cependant, une fois qu'une scène NeRF est créée, ces méthodes manquent souvent de contrôle supplémentaire sur la géométrie et l'apparence résultantes. Par conséquent, NeRF Editing est récemment devenu un axe de recherche digne d’attention.

Les méthodes d'édition NeRF actuelles sont généralement spécifiques à des tâches, telles que l'édition basée sur le texte, la super-résolution, l'inpainting et la colorisation de NeRF. Ces méthodes nécessitent une grande quantité de connaissances dans un domaine spécifique à une tâche. Dans le domaine de l'édition d'images 2D, il est devenu courant de développer des méthodes universelles de conversion d'image en image. Par exemple, le modèle génératif 2D Stable Difussion est utilisé pour prendre en charge l'édition d'images multifonctionnelle. Par conséquent, nous proposons une édition NeRF universelle utilisant des modèles génératifs 2D sous-jacents.

Un défi qui vient avec cela est l'écart de représentation entre les images NeRF et 2D, d'autant plus que les éditeurs d'images génèrent souvent plusieurs modifications incohérentes pour différents points de vue. Une récente méthode d’édition NeRF basée sur du texte, Instruct-NeRF2NeRF, explore cela. Il adopte le processus « rendu-édition-agrégation » pour mettre à jour progressivement la scène NeRF en rendant progressivement des images multi-vues, en éditant ces images et en agrégeant les images modifiées dans NeRF. Cependant, cette méthode d'édition, après de nombreuses optimisations pour des besoins d'édition spécifiques, ne peut générer un résultat d'édition spécifique que si l'utilisateur n'est pas satisfait, des tentatives itératives doivent être répétées.

Par conséquent, nous avons proposé "GenN2N", un cadre général NeRF-to-NeRF adapté à une variété de tâches d'édition NeRF. Son cœur est d'utiliser une approche générative pour caractériser la nature multi-solutions du processus d'édition, afin qu'il puisse utiliser l'édition générative pour générer facilement un grand nombre de résultats d'édition qui répondent aux exigences de sélection des utilisateurs.

Dans la partie centrale de GenN2N, 1) le cadre génératif de 3D VAE-GAN est introduit, en utilisant VAE pour représenter l'ensemble de l'espace d'édition afin d'apprendre toutes les distributions d'édition NeRF 3D possibles correspondant à un ensemble d'images d'édition 2D d'entrée , et utilisez GAN pour fournir une supervision raisonnable pour l'édition de différentes vues de NeRF afin de garantir l'authenticité des résultats de l'édition 2) Utiliser l'apprentissage contrastif pour découpler le contenu d'édition et les perspectives afin de garantir la cohérence de l'édition du contenu entre les différentes perspectives 3) Pendant l'inférence. , l'utilisateur échantillonne simplement au hasard plusieurs codes d'édition à partir du modèle de génération conditionnelle peut générer divers résultats d'édition 3D correspondant à la cible d'édition.

Par rapport aux méthodes SOTA pour diverses tâches d'édition NeRF (ICCV2023 Oral, etc.), GenN2N est supérieure aux méthodes existantes en termes de qualité d'édition, de diversité, d'efficacité, etc.

Introduction à la méthode

Nous effectuons d'abord l'édition d'images 2D, puis mettons à niveau ces modifications 2D vers NeRF 3D pour obtenir une conversion générative NeRF en NeRF.

A. Distillation implicite (distillation latente)

Nous utilisons le module de distillation latente comme encodeur de VAE pour apprendre un code d'édition implicite pour chaque image modifiée et le transmettons dans la conversion NeRF en NeRF. contrôle le contenu généré. Tous les codes d'édition obéissent à une bonne distribution normale sous la contrainte de perte KL pour un meilleur échantillonnage. Afin de dissocier le contenu d'édition et la perspective, nous avons soigneusement conçu un apprentissage contrastif pour encourager les codes d'édition d'images avec le même style d'édition mais des perspectives différentes à être similaires, et les codes d'édition d'images avec des styles d'édition différents mais la même perspective à être loin. Loin les uns des autres.

Conversion B.NeRF-to-NeRF (Traduit NeRF)

Nous utilisons la traduction NeRF-to-NeRF comme décodeur de VAE, qui prend le code d'édition en entrée et modifie le NeRF original pour un NeRF converti. Nous avons ajouté des couches résiduelles entre les couches cachées du réseau NeRF d'origine. Ces couches résiduelles utilisent le code d'édition comme entrée pour moduler les neurones de la couche cachée, de sorte que le NeRF converti puisse non seulement conserver les informations NeRF d'origine, mais également contrôler la conversion 3D. basé sur le contenu d’édition. Dans le même temps, la traduction NeRF-to-NeRF sert également de générateur pour participer à une formation contradictoire générative. En générant plutôt qu'en optimisant, nous pouvons obtenir plusieurs résultats de conversion à la fois, améliorant considérablement l'efficacité de la conversion NeRF et la diversité des résultats.

C. Discriminateur conditionnel

Les images rendues converties en NeRF constituent l'espace de génération qu'il faut distinguer. Les styles d'édition et les perspectives de rendu de ces images sont différents, rendant l'espace de génération très complexe. . Par conséquent, nous fournissons une condition comme information supplémentaire pour le discriminateur. Plus précisément, lorsque le discriminateur identifie l'image rendue par le générateur CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务 (échantillon négatif) ou l'image modifiée CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务 (échantillon positif) dans les données d'entraînement, nous sélectionnons une image modifiée CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务 de la même perspective à partir des données d'entraînement comme condition, ce qui empêche le Le discriminateur n'est pas gêné par des facteurs de perspective lors de la distinction des échantillons positifs et négatifs.

D. Inférence

Après l'optimisation GenN2N, les utilisateurs peuvent échantillonner de manière aléatoire les codes d'édition de la distribution normale et saisir le NeRF converti pour générer du code NeRF 3D multi-édité de haute qualité. scènes.

Expériences

Nous avons mené des expériences approfondies sur une variété de tâches NeRF à NeRF, notamment l'édition de texte NeRF, la colorisation, la super-résolution, l'inpainting, etc. Les résultats expérimentaux démontrent la qualité d’édition supérieure de GenN2N, la cohérence multi-vues, la diversité générée et l’efficacité de l’édition.

A. Édition NeRF basée sur du texte CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务B CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务Expériences de comparaison CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务Notre méthode est comparée qualitativement et quantitativement à SO. Méthodes TA pour diverses tâches NeRF spécifiques ( y compris l'édition basée sur le texte, la colorisation, la super-résolution et l'inpainting, etc.). Les résultats montrent que GenN2N, en tant que cadre général, fonctionne aussi bien ou mieux que SOTA spécifique à une tâche, tandis que les résultats d'édition ont une plus grande diversité (ce qui suit est une comparaison entre GenN2N et Instruct-NeRF2NeRF sur la tâche d'édition NeRF basée sur du texte. ).

A. Édition NeRF basée sur du texteCVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务
Pour plus d'expériences et de méthodes, veuillez vous référer à la page d'accueil du papier.

Présentation de l'équipe

Cet article provient de l'équipe Tan Ping de l'Université des sciences et technologies de Hong Kong, du laboratoire 3DVICI de l'Université Tsinghua, du laboratoire d'intelligence artificielle de Shanghai et de l'institut de recherche Qizhi de Shanghai. L'article est Liu, étudiant à l'Université des sciences et technologies de Hong Kong, Xiang Yue, Xue Han, étudiant à l'Université de Tsinghua, Luo Kunming, étudiant à l'Université des sciences et technologies de Hong Kong, et les instructeurs sont le professeur Yi Li de Tsinghua. Université et professeur Tan Ping de l'Université des sciences et technologies de Hong Kong.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment se connecter au réseau public du serveur GIT Comment se connecter au réseau public du serveur GIT Apr 17, 2025 pm 02:27 PM

La connexion d'un serveur GIT au réseau public comprend cinq étapes: 1. Configurer l'adresse IP publique; 2. Ouvrez le port de pare-feu (22, 9418, 80/443); 3. Configurer l'accès SSH (générer des paires de clés, créer des utilisateurs); 4. Configurer l'accès HTTP / HTTPS (installer les serveurs, configurer les autorisations); 5. Testez la connexion (en utilisant les commandes SSH Client ou GIT).

Comment ajouter des clés publiques au compte GIT Comment ajouter des clés publiques au compte GIT Apr 17, 2025 pm 02:42 PM

Comment ajouter une clé publique à un compte GIT? Étape: générer une paire de clés SSH. Copiez la clé publique. Ajoutez une clé publique dans Gitlab ou GitHub. Testez la connexion SSH.

Comment détecter SSH par Git Comment détecter SSH par Git Apr 17, 2025 pm 02:33 PM

Pour détecter SSH via GIT, vous devez effectuer les étapes suivantes: générer une paire de clés SSH. Ajoutez la clé publique au serveur GIT. Configurez Git pour utiliser SSH. Testez la connexion SSH. Résoudre les problèmes possibles en fonction des conditions réelles.

Comment séparer Git Commit Comment séparer Git Commit Apr 17, 2025 pm 02:36 PM

Utilisez GIT pour soumettre le code séparément, en fournissant un suivi granulaire des changements et une capacité de travail indépendante. Les étapes sont les suivantes: 1. Ajouter les fichiers modifiés; 2. Soumettre des modifications spécifiques; 3. Répétez les étapes ci-dessus; 4. Pousser la soumission au référentiel distant.

Comment gérer le conflit du code GIT Comment gérer le conflit du code GIT Apr 17, 2025 pm 02:51 PM

Le conflit de code fait référence à un conflit qui se produit lorsque plusieurs développeurs modifient le même morceau de code et provoquent la fusion de Git sans sélectionner automatiquement les modifications. Les étapes de résolution incluent: ouvrez le fichier contradictoire et découvrez le code contradictoire. Furiez le code manuellement et copiez les modifications que vous souhaitez maintenir dans le marqueur de conflit. Supprimer la marque de conflit. Enregistrer et soumettre des modifications.

Comment construire un serveur GIT Comment construire un serveur GIT Apr 17, 2025 pm 12:57 PM

La construction d'un serveur GIT comprend: l'installation de GIT sur le serveur. Créer des utilisateurs et des groupes qui exécutent le serveur. Créez un répertoire de référentiel GIT. Initialisez le référentiel nu. Configurer les paramètres de contrôle d'accès. Démarrez le service SSH. Accorder l'accès à l'utilisateur. Tester la connexion.

Que faire si Git soumet une branche échelonnée Que faire si Git soumet une branche échelonnée Apr 17, 2025 pm 02:24 PM

Après vous être engagé dans la mauvaise branche, vous pouvez le résoudre par: déterminer que la mauvaise branche crée une nouvelle branche, pointant vers la bonne branche, appliquez la validation à la nouvelle branche pousse la nouvelle branche vers le référentiel distant pour supprimer la mauvaise branche. Force Met à jour la branche distante

Comment ajouter des variables d'environnement à Git Comment ajouter des variables d'environnement à Git Apr 17, 2025 pm 02:39 PM

Comment ajouter des variables d'environnement à GIT: modifiez le fichier .gitconfig. Ajouter Env = key = valeur dans le bloc [core]. Enregistrer et quitter le fichier. Recharger la configuration GIT (configuration git --reload). Vérifiez les variables d'environnement (Git Config --get Core.env.my_env_var).

See all articles