


NVIDIA kündigt das Neuralangelo-KI-Modell an, das Videoinhalte in hochpräzise 3D-Modelle umwandeln kann
IT House News Am 2. Juni kündigte Nvidia diese Woche die Einführung eines KI-Modells namens Neuralangelo an, das Videoclips in 3D-Modelle mit hohem Detaillierungsgrad und Texturen umwandeln kann.
▲ Bildquelle NVIDIA
IT House erkundigte sich und erfuhr, dass es mehrere KIs gibt, die 3D-Modelle basierend auf Videoinhalten generieren, diese KIs jedoch oft nicht starten können, wenn sie mit kontrastarmen Videos konfrontiert werden. Das Neuralangelo-Modell von Nvidia verwendet sofortige neuronale Grafikprimitive und nutzt seine eigene Instant NeRF-Technologie, sodass selbst Videos mit geringem Kontrast subtile Details erfassen und in ein kommerzielleres 3D-Modell umwandeln können.
▲ Bildquelle NVIDIA
NVIDIA betont, dass sich die Einzigartigkeit von Neuralangelo vor allem in seiner „Genauigkeit“ und „Universalität“ widerspiegelt:
- Genauigkeit bedeutet, dass das Modell die Textur komplexer Materialien wie Dachziegel, Glasscheiben und glatten Marmor genau darstellen kann ;
- „Universal“ bedeutet, dass Entwickler einfach mit Smartphones aufgenommenes Videomaterial verwenden können, um realistische Objekte zu erstellen und diese in ihre Projekte zu integrieren.
▲ Bildquelle NVIDIA
Das Neuralangelo-Modell verwendet Videos von Gegenständen, die aus verschiedenen Blickwinkeln aufgenommen wurden, als Eingabematerial, um die Modelle zu generieren, die die Ersteller benötigen. Sobald Neuralangelo die Bewegung der Kamera im Video bestimmt, erstellt es einen 3D-Umriss des Modells und beginnt mit dem Herausarbeiten von Details.
▲ Bildquelle NVIDIA
Nvidia wird das Neuralangelo-Modell voraussichtlich auf der Computer Vision and Pattern Recognition (CVPR)-Konferenz vorstellen, die vom 18. bis 22. Juni stattfindet. Bei internen Vorführungen zeigte NVIDIA restaurierte 3D-Modelle von Alltagsgegenständen wie Michelangelos berühmte Skulptur „David“, die nach dem Neuralangelo-Modell rekonstruiert wurde, NVIDIAs Büros in der Bay Area und Tieflader.
▲ Bildquelle NVIDIA
Zu den von Nvidia auf der Konferenz ausgestellten Modellen gehörte neben Neuralangelo auch ein Modell namens DiffCollage. DiffCollage ist ein KI-Modell, das Videos durch Textaufforderungen generieren kann. Es kann 360-Grad-Panoramabilder und dynamische Bilder in Schleife erzeugen und diese Bilder dann zu bestimmten Videos erweitern.
Ming-Yu Liu, leitender Direktor von NVIDIA Research und Autor des Papiers, äußerte sich zur Bedeutung dieser Forschung:
Die von Neuralangelo bereitgestellten 3D-Rekonstruktionsfunktionen werden den Entwicklern enorme Vorteile bringen und ihnen helfen, die reale Welt in der digitalen Welt nachzubilden. Dieses Tool wird es Entwicklern schließlich ermöglichen, detaillierte Objekte – seien es kleine Statuen oder große Gebäude – in virtuelle Umgebungen in Videospielen oder industrielle digitale Zwillinge zu importieren.
Freunde von IT House finden den spezifischen Inhalt des Papiers hier.
Das obige ist der detaillierte Inhalt vonNVIDIA kündigt das Neuralangelo-KI-Modell an, das Videoinhalte in hochpräzise 3D-Modelle umwandeln kann. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Die Vibe -Codierung verändert die Welt der Softwareentwicklung, indem wir Anwendungen mit natürlicher Sprache anstelle von endlosen Codezeilen erstellen können. Inspiriert von Visionären wie Andrej Karpathy, lässt dieser innovative Ansatz Dev

Dall-e 3: Ein generatives KI-Bilderstellungstool Generative AI revolutioniert die Erstellung von Inhalten, und Dall-E 3, das neueste Bildgenerierungsmodell von OpenAI, steht vor der Spitze. Veröffentlicht im Oktober 2023 baut es auf seinen Vorgängern Dall-E und Dall-E 2 auf

Februar 2025 war ein weiterer bahnbrechender Monat für die Generative KI, die uns einige der am meisten erwarteten Modell-Upgrades und bahnbrechenden neuen Funktionen gebracht hat. Von Xais Grok 3 und Anthropics Claude 3.7 -Sonett, um g zu eröffnen

Yolo (Sie schauen nur einmal) war ein führender Echtzeit-Objekterkennungsrahmen, wobei jede Iteration die vorherigen Versionen verbessert. Die neueste Version Yolo V12 führt Fortschritte vor, die die Genauigkeit erheblich verbessern

Das 500 -Milliarden -Dollar -Stargate AI -Projekt, das von Tech -Giganten wie Openai, Softbank, Oracle und Nvidia unterstützt und von der US -Regierung unterstützt wird, zielt darauf ab, die amerikanische KI -Führung zu festigen. Dieses ehrgeizige Unternehmen verspricht eine Zukunft, die von AI Advanceme geprägt ist

Google's Veo 2 und Openais Sora: Welcher AI -Videogenerator regiert oberste? Beide Plattformen erzeugen beeindruckende KI -Videos, aber ihre Stärken liegen in verschiedenen Bereichen. Dieser Vergleich unter Verwendung verschiedener Eingabeaufforderungen zeigt, welches Werkzeug Ihren Anforderungen am besten entspricht. T

Gencast von Google Deepmind: Eine revolutionäre KI für die Wettervorhersage Die Wettervorhersage wurde einer dramatischen Transformation unterzogen, die sich von rudimentären Beobachtungen zu ausgefeilten AI-angetriebenen Vorhersagen überschreitet. Google DeepMinds Gencast, ein Bodenbrei

Der Artikel erörtert KI -Modelle, die Chatgpt wie Lamda, Lama und Grok übertreffen und ihre Vorteile in Bezug auf Genauigkeit, Verständnis und Branchenauswirkungen hervorheben. (159 Charaktere)
