Apple développe « AI architect » GAUDI : génère des scènes 3D ultra-réalistes à base de texte !-IA-php.cn

Maison

Périphériques technologiques

Apple développe « AI architect » GAUDI : génère des scènes 3D ultra-réalistes à base de texte !

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 02, 2023 pm 03:46 PM

ai 建筑师

De nos jours, de nouveaux modèles d'images générés par texte sont publiés de temps en temps, et chacun d'eux a des effets très puissants. Ils étonnent toujours tout le monde. Ce domaine a déjà atteint le ciel. Cependant, les systèmes d'IA tels que DALL-E 2 d'OpenAI ou Imagen de Google ne peuvent générer que des images en deux dimensions. Si le texte peut également être transformé en une scène en trois dimensions, l'expérience visuelle sera doublée. Aujourd'hui, l'équipe IA d'Apple a lancé la dernière architecture neuronale pour la génération de scènes 3D - GAUDI. Il peut capturer une distribution de scènes 3D complexe et réaliste, immersive à partir de caméras mobiles. Rendu et création de scènes 3D basées sur des invites de texte ! Le modèle porte le nom d'Antoni Gaudi, un célèbre architecte espagnol.

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

Adresse papier : https://arxiv.org/pdf/2207.13751.pdf#🎜 🎜#

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！ 1

Rendu 3D basé sur les NeRF

Le rendu neuronal combine l'infographie avec l'intelligence artificielle , de nombreux systèmes permettant de générer des modèles 3D à partir d'images 2D ont été réalisés. Par exemple, le 3D MoMa récemment développé par Nvidia peut créer un modèle 3D à partir de moins de 100 photos en une heure. Google s'appuie également sur les champs de rayonnement neuronal (NeRF) pour combiner les images satellite 2D et Street View en scènes 3D dans Google Maps afin d'obtenir des vues immersives. HumanNeRF de Google peut également restituer des corps humains en 3D à partir de vidéos.

Actuellement, les NeRF sont principalement utilisés comme support de stockage neuronal pour les modèles 3D et les scènes 3D qui peuvent être restituées sous différentes perspectives de caméra. Les NeRF commencent également à être utilisés dans les expériences de réalité virtuelle.

Alors, les NeRF, avec leur puissante capacité à restituer de manière réaliste des images sous différents angles de caméra, peuvent-ils être utilisés dans l'IA générative ? Bien sûr, certaines équipes de recherche ont essayé de générer des scènes 3D. Par exemple, Google a lancé pour la première fois l'année dernière le système d'IA Dream Fields. Il combine la capacité de NeRF à générer des vues 3D avec la capacité d'OpenAI à évaluer le contenu des images. , et obtient enfin la possibilité de générer une description textuelle correspondante NeRF.

Légende : Google Dream Fields

# 🎜🎜#

Cependant, Dream Fields de Google ne peut générer qu'une vue 3D d'un seul objet, et il existe encore de nombreuses difficultés pour l'étendre à une scène 3D totalement libre. La plus grande difficulté est qu'il existe de grandes restrictions sur la position de la caméra. Pour un seul objet, toutes les positions possibles et raisonnables de la caméra peuvent être mappées sur un dôme, mais dans une scène 3D, la position de la caméra sera affectée par les objets. et les murs, etc. Limites d’obstacles. Si ces facteurs ne sont pas pris en compte lors de la génération de la scène, il sera difficile de générer une scène 3D. 苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

2 expert en rendu 3D GAUDI

Pour le problème ci-dessus de position limitée de la caméra, le modèle GAUDI d'Apple Come avec trois réseaux spécialisés pour vous faciliter la tâche : GAUDI dispose d'un

décodeur de pose de caméra, qui sépare la pose de la caméra de la géométrie 3D et de l'apparence de la scène, et peut prédire la position possible de la caméra, Et assurez-vous que la sortie est un emplacement valide pour l’architecture de la scène 3D.

Remarque : Architecture du modèle de décodeur #🎜🎜 #Pour sceneScene decoder

peut prédire la représentation d'un plan tridimensionnel, qui est une toile 3D.

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

Ensuite, Radiation Field Decoder utilisera l'équation de rendu de volume sur cette toile pour dessiner les images suivantes. La génération 3D de GAUDI se compose de deux étapes :

L'une d'entre elles est l'optimisation des paramètres latents et de réseau : l'apprentissage de représentations latentes qui codent les champs de rayonnement 3D et les poses de caméra correspondantes pour des milliers de trajectoires. Contrairement à un objet unique, la pose effective de la caméra varie en fonction de la scène, il est donc nécessaire d'encoder la pose de caméra valide pour chaque scène.

La seconde consiste à utiliser le modèle de diffusion pour apprendre un modèle génératif sur la représentation latente, afin qu'il puisse bien se modéliser dans les tâches de raisonnement conditionnel et inconditionnel. Le premier génère des scènes 3D basées sur des invites de texte ou d'image, tandis que le second génère des scènes 3D basées sur les trajectoires de caméra.

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

Avec les scènes d'intérieur 3D, GAUDI peut générer de nouveaux mouvements de caméra. Comme dans certains des exemples ci-dessous, la description textuelle contient des informations sur la scène et le chemin de navigation. Ici, l'équipe de recherche a adopté un encodeur de texte pré-entraîné basé sur RoBERTa et a utilisé sa représentation intermédiaire pour ajuster le modèle de diffusion. L'effet généré est le suivant : Invite de texte : Entrez dans la cuisine

. #🎜🎜 # 苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

Invite de texte : Montez à l'étage

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

Texte invite : Porter Traverser le couloir 18 est utilisé comme codage d'image. GAUDI est capable de créer des scènes 3D à partir d'indices d'image en échantillonnant le champ de rayonnement d'une image donnée vue depuis des points de vue aléatoires. Invite d'image :

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！ Générer une scène 3D :

#🎜🎜 #

Invite d'image : 苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

Générer une scène 3D : #🎜 Les chercheurs ont mené des expériences sur quatre ensembles de données différents, y compris l'ensemble de données d'analyse intérieure ARKitScences, et les résultats montrent que GAUDI peut reconstruire la vue d'apprentissage et égaler la qualité des méthodes existantes. Même dans l'énorme tâche consistant à produire des scènes 3D avec des centaines de milliers d'images pour des milliers de scènes d'intérieur, GAUDI n'a pas souffert de problèmes d'effondrement de mode ou d'orientation. 苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！

L'émergence de GAUDI n'aura pas seulement un impact sur de nombreuses tâches de vision par ordinateur, mais ses capacités de génération de scènes 3D seront également bénéfiques pour l'apprentissage et la planification par renforcement basés sur des modèles. , SLAM et des domaines de recherche tels que la production de contenu 3D.

苹果开发「AI 建筑师」GAUDI：根据文本生成超逼真 3D 场景！ À l'heure actuelle, la qualité de la vidéo générée par GAUDI n'est pas élevée et de nombreux artefacts peuvent être vus. Cependant, ce système pourrait constituer un bon début et une base pour le système d'IA actuel d'Apple pour le rendu d'objets et de scènes 3D. Il est dit que GAUDI sera également appliqué aux casques XR d'Apple pour générer des positions numériques. Vous pouvez l'attendre avec impatience ~

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

Économie dans R.E.P.O. Expliqué (et enregistrer des fichiers)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Comment trouver le forgeron et déverrouiller les armes et la personnalisation des armes

4 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7563

Tutoriel CakePHP

1385

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Ligne de commande de l'arrêt CentOS Apr 14, 2025 pm 09:12 PM

La commande de fermeture CENTOS est arrêtée et la syntaxe est la fermeture de [options] le temps [informations]. Les options incluent: -H Arrêtez immédiatement le système; -P éteignez l'alimentation après l'arrêt; -r redémarrer; -t temps d'attente. Les temps peuvent être spécifiés comme immédiats (maintenant), minutes (minutes) ou une heure spécifique (HH: mm). Des informations supplémentaires peuvent être affichées dans les messages système.

Quelles sont les méthodes de sauvegarde pour Gitlab sur Centos Apr 14, 2025 pm 05:33 PM

La politique de sauvegarde et de récupération de GitLab dans le système CentOS afin d'assurer la sécurité et la récupérabilité des données, Gitlab on CentOS fournit une variété de méthodes de sauvegarde. Cet article introduira plusieurs méthodes de sauvegarde courantes, paramètres de configuration et processus de récupération en détail pour vous aider à établir une stratégie complète de sauvegarde et de récupération de GitLab. 1. MANUEL BACKUP Utilisez le Gitlab-RakegitLab: Backup: Créer la commande pour exécuter la sauvegarde manuelle. Cette commande sauvegarde des informations clés telles que le référentiel Gitlab, la base de données, les utilisateurs, les groupes d'utilisateurs, les clés et les autorisations. Le fichier de sauvegarde par défaut est stocké dans le répertoire / var / opt / gitlab / backups. Vous pouvez modifier / etc / gitlab

Comment vérifier la configuration de CentOS HDFS Apr 14, 2025 pm 07:21 PM

Guide complet pour vérifier la configuration HDFS dans les systèmes CentOS Cet article vous guidera comment vérifier efficacement la configuration et l'état de l'exécution des HDF sur les systèmes CentOS. Les étapes suivantes vous aideront à bien comprendre la configuration et le fonctionnement des HDF. Vérifiez la variable d'environnement Hadoop: Tout d'abord, assurez-vous que la variable d'environnement Hadoop est correctement définie. Dans le terminal, exécutez la commande suivante pour vérifier que Hadoop est installé et configuré correctement: HadoopVersion Check HDFS Fichier de configuration: Le fichier de configuration de base de HDFS est situé dans le répertoire / etc / hadoop / conf / le répertoire, où Core-site.xml et hdfs-site.xml sont cruciaux. utiliser

Comment est la prise en charge du GPU pour Pytorch sur Centos Apr 14, 2025 pm 06:48 PM

Activer l'accélération du GPU Pytorch sur le système CentOS nécessite l'installation de versions CUDA, CUDNN et GPU de Pytorch. Les étapes suivantes vous guideront tout au long du processus: CUDA et CUDNN Installation détermineront la compatibilité de la version CUDA: utilisez la commande NVIDIA-SMI pour afficher la version CUDA prise en charge par votre carte graphique NVIDIA. Par exemple, votre carte graphique MX450 peut prendre en charge CUDA11.1 ou plus. Téléchargez et installez Cudatoolkit: visitez le site officiel de Nvidiacudatoolkit et téléchargez et installez la version correspondante selon la version CUDA la plus élevée prise en charge par votre carte graphique. Installez la bibliothèque CUDNN:

Explication détaillée du principe docker Apr 14, 2025 pm 11:57 PM

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

CentOS installe MySQL Apr 14, 2025 pm 08:09 PM

L'installation de MySQL sur CENTOS implique les étapes suivantes: Ajout de la source MySQL YUM appropriée. Exécutez la commande YUM Install MySQL-Server pour installer le serveur MySQL. Utilisez la commande mysql_secure_installation pour créer des paramètres de sécurité, tels que la définition du mot de passe de l'utilisateur racine. Personnalisez le fichier de configuration MySQL selon les besoins. Écoutez les paramètres MySQL et optimisez les bases de données pour les performances.

Comment afficher les journaux Gitlab sous Centos Apr 14, 2025 pm 06:18 PM

Un guide complet pour consulter les journaux GitLab sous Centos System Cet article vous guidera comment afficher divers journaux GitLab dans le système CentOS, y compris les journaux principaux, les journaux d'exception et d'autres journaux connexes. Veuillez noter que le chemin du fichier journal peut varier en fonction de la version Gitlab et de la méthode d'installation. Si le chemin suivant n'existe pas, veuillez vérifier le répertoire d'installation et les fichiers de configuration de GitLab. 1. Afficher le journal GitLab principal Utilisez la commande suivante pour afficher le fichier journal principal de l'application GitLabRails: Commande: sudocat / var / log / gitlab / gitlab-rails / production.log Cette commande affichera le produit

Comment choisir une base de données Gitlab dans CentOS Apr 14, 2025 pm 05:39 PM

Lors de l'installation et de la configuration de GitLab sur un système CentOS, le choix de la base de données est crucial. Gitlab est compatible avec plusieurs bases de données, mais PostgreSQL et MySQL (ou MARIADB) sont le plus couramment utilisés. Cet article analyse les facteurs de sélection de la base de données et fournit des étapes détaillées d'installation et de configuration. Guide de sélection de la base de données Lors du choix d'une base de données, vous devez considérer les facteurs suivants: PostgreSQL: la base de données par défaut de GitLab est puissante, a une évolutivité élevée, prend en charge les requêtes complexes et le traitement des transactions et convient aux grands scénarios d'application. MySQL / MARIADB: une base de données relationnelle populaire largement utilisée dans les applications Web, avec des performances stables et fiables. MongoDB: base de données NoSQL, se spécialise dans

See all articles