


NVIDIA annonce le modèle Neuralangelo AI capable de convertir le contenu vidéo en modèles 3D de haute précision
IT House News le 2 juin, Nvidia a annoncé cette semaine le lancement d'un modèle d'IA appelé Neuralangelo, capable de convertir des clips vidéo en modèles 3D avec des niveaux de détails et de textures riches.
▲ Source de l'image NVIDIA
IT House s'est renseigné et a appris qu'il existe plusieurs IA qui génèrent des modèles 3D basés sur du contenu vidéo, mais que ces IA sont souvent incapables de démarrer lorsqu'elles sont confrontées à des vidéos à faible contraste. Le modèle Neuralangelo de Nvidia utilise des primitives graphiques neuronales instantanées et utilise sa propre technologie Instant NeRF, de sorte que même les vidéos à faible contraste peuvent capturer des détails subtils et les convertir en un modèle 3D de valeur plus commerciale.
▲ Source de l'image NVIDIA
NVIDIA souligne que le caractère unique de Neuralangelo se reflète principalement dans sa « précision » et son « universalité » :
- La précision signifie que le modèle peut représenter avec précision la texture de matériaux complexes, tels que les tuiles, les vitres et le marbre lisse ; « Universel » signifie que les créateurs peuvent simplement utiliser des séquences vidéo tournées avec des smartphones pour créer des objets réalistes et les intégrer dans leurs projets.
Le modèle Neuralangelo utilise des vidéos d'éléments pris sous différents angles comme matériau d'entrée pour générer les modèles dont les créateurs ont besoin. Une fois que Neuralangelo a déterminé le mouvement de la caméra dans la vidéo, il génère un contour 3D du modèle et commence à y sculpter des détails.
Nvidia devrait lancer le modèle Neuralangelo lors de la conférence Computer Vision and Pattern Recognition (CVPR) qui se tiendra du 18 au 22 juin. Lors de démonstrations internes, NVIDIA a montré des modèles restaurés en 3D d'objets du quotidien tels que la célèbre sculpture « David » de Michel-Ange reconstruite par le modèle Neuralangelo, les bureaux de NVIDIA dans la Bay Area et des remorques à plateau.
En plus de Neuralangelo, les modèles présentés par Nvidia lors de la conférence en comprenaient également un appelé DiffCollage. DiffCollage est un modèle d'IA qui peut générer des vidéos via des invites textuelles. Il peut générer des images panoramiques à 360 degrés et des images dynamiques en boucle, puis étendre ces images en vidéos spécifiques.
Ming-Yu Liu, directeur principal de NVIDIA Research et auteur de l'article, a donné son avis sur l'importance de cette recherche :
Les capacités de reconstruction 3D fournies par Neuralangelo apporteront d'énormes avantages aux créateurs, les aidant à recréer le monde réel dans le monde numérique. Cet outil permettra à terme aux développeurs d’importer des objets détaillés – qu’il s’agisse de petites statues ou de grands bâtiments – dans des environnements virtuels de jeux vidéo ou de jumeaux numériques industriels.Les amis d'IT House peuvent trouver le contenu spécifique de l'article ici.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Gencast de Google Deepmind: une IA révolutionnaire pour les prévisions météorologiques Les prévisions météorologiques ont subi une transformation spectaculaire, passant des observations rudimentaires aux prédictions sophistiquées alimentées par l'IA. Gencast de Google Deepmind, un terreau

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

O1'S O1: Une vague de cadeaux de 12 jours commence par leur modèle le plus puissant à ce jour L'arrivée de décembre apporte un ralentissement mondial, les flocons de neige dans certaines parties du monde, mais Openai ne fait que commencer. Sam Altman et son équipe lancent un cadeau de don de 12 jours

Mistral OCR: révolutionner la génération de la récupération avec une compréhension du document multimodal Les systèmes de génération (RAG) (RAG) de la récupération ont considérablement avancé les capacités d'IA, permettant à de vastes magasins de données pour une responsabilité plus éclairée
