Table des matières
Contexte
Représentation NeRF humaine efficace
Cadre GAN humain tridimensionnel
Ensembles de données extrêmement déséquilibrés
Résultats de génération de haute qualité
Potentiel d'application
Conclusion
Maison Périphériques technologiques IA Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter n'importe quel vêtement et modifier vos mouvements.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter n'importe quel vêtement et modifier vos mouvements.

Apr 11, 2023 pm 02:31 PM
图像

Grâce au rendu différenciable fourni par NeRF, les modèles génératifs 3D récents ont obtenu des résultats époustouflants sur des objets stationnaires. Cependant, dans une catégorie plus complexe et déformable comme le corps humain, la génération 3D pose encore de grands défis. Cet article propose une représentation NeRF combinée efficace du corps humain, permettant la génération de corps humain 3D haute résolution (512 x 256) sans utiliser de modèles de super-résolution. EVA3D a largement surpassé les solutions existantes sur quatre ensembles de données du corps humain à grande échelle, et le code est open source.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.


  • Nom de l'article : EVA3D : Génération humaine compositionnelle en 3D à partir de collections d'images 2D
  • Adresse de l'article : https://arxiv.org/abs/2210.04888
  • Accueil du projet page : https : //hongfz16.github.io/projects/EVA3D.html
  • Code open source : https://github.com/hongfz16/EVA3D
  • Démo Colab : https://colab.research.google.com / github/hongfz16/EVA3D/blob/main/notebook/EVA3D_Demo.ipynb
  • Démo Hugging Face : https://huggingface.co/spaces/hongfz16/EVA3D


Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.


Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.


Contexte

En utilisant l'algorithme de rendu différenciable fourni par NeRF, les algorithmes de génération tridimensionnelle, tels que EG3D et StyleSDF, ont obtenu de très bons résultats dans la génération de catégories d'objets statiques. Cependant, comparé à des catégories telles que les visages ou les modèles CAO, le corps humain est plus complexe en apparence et en géométrie, et le corps humain est déformable, donc apprendre à générer des corps humains 3D à partir d'images 2D reste une tâche très difficile. Les chercheurs ont fait quelques tentatives dans ce domaine, comme ENARF-GAN et GNARF, mais limités par une expression humaine inefficace, ils ne peuvent pas réaliser une génération à haute résolution, de sorte que la qualité de la génération est également très faible.

Pour résoudre ce problème, cet article propose une représentation NeRF 3D combinée efficace du corps humain pour obtenir une formation et une génération GAN 3D du corps humain haute résolution (512x256). La représentation NeRF humaine proposée dans cet article et le cadre de formation GAN humain tridimensionnel seront présentés ci-dessous.

Représentation NeRF humaine efficace

Le NeRF humain proposé dans cet article est basé sur le modèle humain paramétrique SMPL, qui permet un contrôle pratique de la posture et de la forme humaines. Lors de la modélisation NeRF, comme le montre la figure ci-dessous, cet article divise le corps humain en 16 parties. Chaque partie correspond à un petit réseau NeRF pour une modélisation locale. Lors du rendu de chaque pièce, cet article n'a besoin que de raisonner sur le NeRF local. Cette méthode de rendu clairsemé peut également obtenir un rendu natif haute résolution avec des ressources informatiques réduites.

Par exemple, lors du rendu d'un corps humain dont les paramètres de corps et d'action sont Les points d'échantillonnage dans l'espace sont transformés en espace canonique. Ensuite, il est calculé que les points d'échantillonnage dans l'espace canonique appartiennent à un ou plusieurs cadres de délimitation NeRF locaux, puis le modèle NeRF est déduit pour obtenir la couleur et la densité correspondant à chaque point d'échantillonnage lorsqu'un certain point d'échantillonnage tombe dans plusieurs locaux ; NeRF Dans la zone de chevauchement, chaque modèle NeRF sera déduit, et plusieurs résultats seront interpolés à l'aide de la fonction fenêtre, enfin, ces informations seront utilisées pour l'intégration de la lumière afin d'obtenir le rendu final ;

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.

Cadre GAN humain tridimensionnel

Basé sur l'expression NeRF humaine efficace proposée, cet article implémente un cadre de formation GAN humain tridimensionnel. À chaque itération de formation, cet article échantillonne d'abord un paramètre SMPL et des paramètres de caméra à partir de l'ensemble de données, puis génère de manière aléatoire un bruit gaussien z. En utilisant le NeRF du corps humain proposé dans cet article, cet article peut restituer les paramètres échantillonnés dans une image bidimensionnelle du corps humain en tant que faux échantillon. À l’aide d’échantillons réels de l’ensemble de données, cet article effectue une formation contradictoire du GAN.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.

Ensembles de données extrêmement déséquilibrés

Les ensembles de données 2D du corps humain, tels que DeepFashion, sont généralement préparés pour les tâches de vision 2D, de sorte que la diversité des poses du corps humain est très limitée. Pour quantifier le degré de déséquilibre, cet article compte la fréquence des orientations du visage du modèle dans DeepFashion. Comme le montre la figure ci-dessous, la ligne orange représente la répartition des orientations du visage dans DeepFashion. On peut voir qu'elle est extrêmement déséquilibrée, ce qui rend difficile l'apprentissage de la représentation tridimensionnelle du corps humain. Pour atténuer ce problème, nous proposons une méthode d'échantillonnage guidée par la posture humaine pour aplatir la courbe de distribution, comme le montrent les autres lignes colorées dans la figure ci-dessous. Cela permet au modèle pendant l'entraînement de voir des images du corps humain plus diversifiées et avec un angle plus grand, aidant ainsi à apprendre la géométrie humaine tridimensionnelle. Nous avons effectué une analyse expérimentale des paramètres d'échantillonnage. Comme le montre le tableau ci-dessous, après avoir ajouté la méthode d'échantillonnage à guidage de posture humaine, bien que la qualité de l'image (FID) soit légèrement réduite, la géométrie tridimensionnelle apprise (profondeur) a été modifiée. sensiblement amélioré.

Résultats de génération de haute qualité

La figure suivante montre certains résultats de génération d'EVA3D EVA3D peut échantillonner de manière aléatoire les apparences du corps humain et contrôler les paramètres de rendu de la caméra, la posture humaine et la forme du corps.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.

Cet article mène des expériences sur quatre ensembles de données humaines à grande échelle, à savoir DeepFashion, SHHQ, UBCFashion et AIST. Cette étude compare l'algorithme de génération d'objets 3D statiques de pointe EG3D avec StyleSDF. Dans le même temps, les chercheurs ont également comparé l’algorithme ENARF-GAN spécifiquement pour la génération humaine en 3D. Dans la sélection des indicateurs, cet article prend en compte l'évaluation de la qualité du rendu (FID/KID), la précision du contrôle du corps humain (PCK) et la qualité de la génération géométrique (Profondeur). Comme le montre la figure ci-dessous, cet article surpasse considérablement les solutions précédentes dans tous les ensembles de données et tous les indicateurs.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.

Potentiel d'application

Enfin, cet article montre également certains potentiels d'application d'EVA3D. Premièrement, l’étude a testé la différenciation dans l’espace latent. Comme le montre la figure ci-dessous, cet article est capable d'effectuer des changements en douceur entre deux personnes en trois dimensions, et les résultats intermédiaires conservent une haute qualité. En outre, cet article a également mené des expériences sur l'inversion GAN. Les chercheurs ont utilisé Pivotal Tuning Inversion, un algorithme couramment utilisé dans l'inversion GAN bidimensionnelle. Comme le montre la figure de droite ci-dessous, cette méthode permet de mieux restaurer l'apparence de la cible reconstruite, mais de nombreux détails sont perdus dans la partie géométrique. On peut voir que l’inversion du GAN 3D reste une tâche très difficile.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter nimporte quel vêtement et modifier vos mouvements.

Conclusion

Cet article propose le premier algorithme de génération NeRF humaine tridimensionnelle haute définition EVA3D, et peut être entraîné en utilisant uniquement des données d'image humaine bidimensionnelles. EVA3D atteint des performances de pointe sur plusieurs ensembles de données humaines à grande échelle et montre un potentiel d'application sur des tâches en aval. Les codes de formation et de test d'EVA3D sont open source et tout le monde est invité à l'essayer !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment effacer l'historique des images récentes de l'arrière-plan du bureau dans Windows 11 Comment effacer l'historique des images récentes de l'arrière-plan du bureau dans Windows 11 Apr 14, 2023 pm 01:37 PM

<p>Windows 11 améliore la personnalisation du système, permettant aux utilisateurs d'afficher un historique récent des modifications précédemment apportées à l'arrière-plan du bureau. Lorsque vous entrez dans la section de personnalisation de l'application Paramètres système Windows, vous pouvez voir diverses options, la modification du fond d'écran en fait partie. Mais vous pouvez maintenant voir le dernier historique des fonds d’écran définis sur votre système. Si vous n'aimez pas voir cela et souhaitez effacer ou supprimer cet historique récent, continuez à lire cet article, qui vous aidera à en savoir plus sur la façon de le faire à l'aide de l'Éditeur du Registre. </p><h2>Comment utiliser la modification du registre

Comment télécharger l'image de fond d'écran Windows Spotlight sur PC Comment télécharger l'image de fond d'écran Windows Spotlight sur PC Aug 23, 2023 pm 02:06 PM

Les fenêtres ne négligent jamais l’esthétique. Des champs verts bucoliques de XP au design tourbillonnant bleu de Windows 11, les fonds d’écran par défaut sont une source de plaisir pour les utilisateurs depuis des années. Avec Windows Spotlight, vous avez désormais un accès direct chaque jour à des images magnifiques et impressionnantes pour votre écran de verrouillage et votre fond d’écran. Malheureusement, ces images ne traînent pas. Si vous êtes tombé amoureux de l'une des images phares de Windows, vous voudrez savoir comment les télécharger afin de pouvoir les conserver comme arrière-plan pendant un certain temps. Voici tout ce que vous devez savoir. Qu’est-ce que WindowsSpotlight ? Window Spotlight est un programme de mise à jour automatique du fond d'écran disponible dans Personnalisation et dans l'application Paramètres.

Comment utiliser la technologie de segmentation sémantique d'images en Python ? Comment utiliser la technologie de segmentation sémantique d'images en Python ? Jun 06, 2023 am 08:03 AM

Avec le développement continu de la technologie de l’intelligence artificielle, la technologie de segmentation sémantique des images est devenue une direction de recherche populaire dans le domaine de l’analyse d’images. Dans la segmentation sémantique d'image, nous segmentons différentes zones d'une image et classons chaque zone pour obtenir une compréhension globale de l'image. Python est un langage de programmation bien connu. Ses puissantes capacités d'analyse et de visualisation de données en font le premier choix dans le domaine de la recherche sur les technologies d'intelligence artificielle. Cet article expliquera comment utiliser la technologie de segmentation sémantique d'images en Python. 1. Les connaissances préalables s’approfondissent

iOS 17 : Comment utiliser le recadrage en un clic des photos iOS 17 : Comment utiliser le recadrage en un clic des photos Sep 20, 2023 pm 08:45 PM

Avec l'application iOS 17 Photos, Apple facilite le recadrage des photos selon vos spécifications. Lisez la suite pour savoir comment. Auparavant, dans iOS 16, le recadrage d'une image dans l'application Photos impliquait plusieurs étapes : appuyez sur l'interface d'édition, sélectionnez l'outil de recadrage, puis ajustez le recadrage à l'aide d'un geste de pincement pour zoomer ou en faisant glisser les coins de l'outil de recadrage. Dans iOS 17, Apple a heureusement simplifié ce processus afin que lorsque vous zoomez sur une photo sélectionnée dans votre bibliothèque Photos, un nouveau bouton Recadrer apparaisse automatiquement dans le coin supérieur droit de l'écran. En cliquant dessus, l'interface de recadrage complète s'affichera avec le niveau de zoom de votre choix. Vous pourrez ainsi recadrer la partie de l'image que vous aimez, faire pivoter l'image, inverser l'image, appliquer un rapport d'écran ou utiliser des marqueurs.

Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter n'importe quel vêtement et modifier vos mouvements. Utilisez des images 2D pour créer un corps humain en 3D. Vous pouvez porter n'importe quel vêtement et modifier vos mouvements. Apr 11, 2023 pm 02:31 PM

Grâce au rendu différenciable fourni par NeRF, les modèles génératifs 3D récents ont obtenu des résultats époustouflants sur des objets stationnaires. Cependant, dans une catégorie plus complexe et déformable comme le corps humain, la génération 3D pose encore de grands défis. Cet article propose une représentation NeRF combinée efficace du corps humain, permettant la génération de corps humain 3D haute résolution (512 x 256) sans utiliser de modèles de super-résolution. EVA3D a largement surpassé les solutions existantes sur quatre ensembles de données du corps humain à grande échelle, et le code est open source. Nom de l'article : EVA3D : Génération humaine compositionnelle en 3D à partir de collections d'images 2D Adresse de l'article : http

Comment redimensionner par lots des images à l'aide de PowerToys sous Windows Comment redimensionner par lots des images à l'aide de PowerToys sous Windows Aug 23, 2023 pm 07:49 PM

Ceux qui doivent travailler quotidiennement avec des fichiers image doivent souvent les redimensionner pour les adapter aux besoins de leurs projets et de leurs tâches. Cependant, si vous avez trop d’images à traiter, les redimensionner individuellement peut prendre beaucoup de temps et d’efforts. Dans ce cas, un outil comme PowerToys peut s'avérer utile, entre autres, pour redimensionner par lots des fichiers image à l'aide de son utilitaire de redimensionnement d'image. Voici comment configurer vos paramètres de redimensionnement d'image et commencer le redimensionnement par lots d'images avec PowerToys. Comment redimensionner des images par lots avec PowerToys PowerToys est un programme tout-en-un doté d'une variété d'utilitaires et de fonctionnalités pour vous aider à accélérer vos tâches quotidiennes. L'un de ses utilitaires est les images

Une nouvelle perspective sur la génération d'images : discussion des méthodes de généralisation basées sur NeRF Une nouvelle perspective sur la génération d'images : discussion des méthodes de généralisation basées sur NeRF Apr 09, 2023 pm 05:31 PM

La nouvelle génération d'images en perspective (NVS) est un domaine d'application de la vision par ordinateur. Dans le jeu SuperBowl de 1998, le RI de la CMU a démontré la vision stéréo multi-caméras (MVS). À cette époque, cette technologie a été transférée à une chaîne de télévision sportive du pays. États-Unis, mais il n’a finalement pas été commercialisé ; la société britannique BBC Broadcasting a investi dans la recherche et le développement à cet effet, mais il n’a pas été véritablement commercialisé. Dans le domaine du rendu basé sur l'image (IBR), il existe une branche des applications NVS, à savoir le rendu basé sur l'image en profondeur (DBIR). De plus, la télévision 3D, qui était très populaire en 2010, devait également obtenir des effets stéréoscopiques binoculaires à partir de la vidéo monoculaire, mais en raison de l'immaturité de la technologie, elle n'est finalement pas devenue populaire. A cette époque, des méthodes basées sur l’apprentissage automatique commençaient déjà à être étudiées, comme

Effacez les imperfections et les rides en un clic : interprétation approfondie du modèle de beauté de la peau haute définition ABPN de la DAMO Academy Effacez les imperfections et les rides en un clic : interprétation approfondie du modèle de beauté de la peau haute définition ABPN de la DAMO Academy Apr 12, 2023 pm 12:25 PM

Avec le développement vigoureux de l’industrie de la culture numérique, la technologie de l’intelligence artificielle a commencé à être largement utilisée dans le domaine de l’édition et de l’embellissement d’images. Parmi elles, l’embellissement de la peau en portrait est sans aucun doute l’une des technologies les plus utilisées et les plus demandées. Les algorithmes de beauté traditionnels utilisent une technologie d'édition d'images basée sur des filtres pour obtenir des effets automatisés de resurfaçage de la peau et d'élimination des imperfections, et ont été largement utilisés dans les réseaux sociaux, les diffusions en direct et d'autres scénarios. Cependant, dans le secteur de la photographie professionnelle, où les seuils sont élevés, en raison des exigences élevées en matière de résolution d'image et de normes de qualité, les retoucheurs manuels restent la principale force productive dans la retouche beauté des portraits, accomplissant des tâches telles que le lissage de la peau, l'élimination des imperfections, le blanchiment, etc. travail. Habituellement, le temps de traitement moyen nécessaire à un retoucheur professionnel pour effectuer des opérations d'embellissement de la peau sur un portrait haute définition est de 1 à 2 minutes. Dans des domaines tels que la publicité, le cinéma et la télévision, qui nécessitent une plus grande précision.

See all articles