Heim Technologie-Peripheriegeräte KI Apple entwickelt „KI-Architekt' GAUDI: Erzeugt ultrarealistische 3D-Szenen basierend auf Text!

Apple entwickelt „KI-Architekt' GAUDI: Erzeugt ultrarealistische 3D-Szenen basierend auf Text!

May 02, 2023 pm 03:46 PM
ai 建筑师

Heutzutage werden von Zeit zu Zeit neue textgenerierte Bildmodelle veröffentlicht, und jedes davon hat sehr starke Auswirkungen. Dieses Feld hat bereits den Himmel erreicht. Allerdings können KI-Systeme wie DALL-E 2 von OpenAI oder Imagen von Google nur zweidimensionale Bilder erzeugen. Wenn Text auch in eine dreidimensionale Szene umgewandelt werden kann, verdoppelt sich das visuelle Erlebnis. Jetzt hat das KI-Team von Apple die neueste neuronale Architektur für die 3D-Szenengenerierung auf den Markt gebracht – GAUDI. Es kann komplexe und realistische 3D-Szenenverteilungen erfassen, immersiv von mobilen Kameras aus rendern und 3D-Szenen basierend auf Textaufforderungen erstellen! Das Modell ist nach Antoni Gaudi benannt, einem berühmten spanischen Architekten.

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Papieradresse: https://arxiv.org/pdf/2207.13751.pdf#🎜 🎜#

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!1

3D-Rendering basierend auf NeRFs

Neuronales Rendering kombiniert Computergrafik mit künstlicher Intelligenz Es wurden viele Systeme zur Generierung von 3D-Modellen aus 2D-Bildern hergestellt. Beispielsweise kann das kürzlich von Nvidia entwickelte 3D MoMa ein 3D-Modell aus weniger als 100 Fotos in einer Stunde erstellen. Google setzt außerdem auf Neural Radiation Fields (NeRFs), um 2D-Satelliten- und Street View-Bilder in 3D-Szenen in Google Maps zu kombinieren und so immersive Ansichten zu erzielen. HumanNeRF von Google kann auch 3D-menschliche Körper aus Videos rendern.

Derzeit werden NeRFs hauptsächlich als neuronales Speichermedium für 3D-Modelle und 3D-Szenen verwendet, die aus verschiedenen Kameraperspektiven gerendert werden können. NeRFs werden auch bereits in Virtual-Reality-Erlebnissen eingesetzt.

Können NeRFs mit ihrer leistungsstarken Fähigkeit, Bilder aus verschiedenen Kamerawinkeln realistisch zu rendern, in der generativen KI eingesetzt werden? Natürlich gibt es Forschungsteams, die versucht haben, 3D-Szenen zu generieren. Google hat beispielsweise letztes Jahr erstmals das KI-System Dream Fields auf den Markt gebracht. Es kombiniert die Fähigkeit von NeRF, 3D-Ansichten zu generieren, mit der Fähigkeit von OpenAI, Bildinhalte auszuwerten und erreicht schließlich die Fähigkeit, eine NeRF-passende Textbeschreibung zu generieren.

Bildunterschrift: Google Dream Fields

# 🎜🎜#

Allerdings kann Googles Dream Fields nur eine 3D-Ansicht eines einzelnen Objekts generieren, und es gibt immer noch viele Schwierigkeiten, diese auf eine völlig uneingeschränkte 3D-Szene zu erweitern. Die größte Schwierigkeit besteht darin, dass es große Einschränkungen hinsichtlich der Position der Kamera gibt. Für ein einzelnes Objekt kann jede mögliche und sinnvolle Kameraposition einer Kuppel zugeordnet werden, in einer 3D-Szene wird die Position der Kamera jedoch durch Objekte beeinflusst und Wände usw. Hindernisbeschränkungen. Wenn diese Faktoren bei der Szenengenerierung nicht berücksichtigt werden, wird es schwierig, eine 3D-Szene zu generieren. 苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

2 3D-Rendering-Experte GAUDI

Für das oben genannte Problem der begrenzten Kameraposition kommt Apples GAUDI-Modell Drei spezialisierte Netzwerke machen es einfach: GAUDI verfügt über einen

Kamera-Posendecoder, , der die Kamera-Pose von der 3D-Geometrie und dem Erscheinungsbild der Szene trennt und die mögliche Position der Kamera vorhersagen kann Stellen Sie sicher, dass die Ausgabe ein gültiger Speicherort für die 3D-Szenenarchitektur ist.

Hinweis: Decoder-Modellarchitektur #🎜🎜 #Für SzenenSzenendecoder

kann die Darstellung einer dreidimensionalen Ebene vorhersagen, bei der es sich um eine 3D-Leinwand handelt.

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Dann verwendet Radiation Field Decoder die Volumenwiedergabegleichung auf dieser Leinwand, um nachfolgende Bilder zu zeichnen. GAUDIs 3D-Generierung besteht aus zwei Phasen:

Eine davon ist die Optimierung latenter und Netzwerkparameter: Lernen latenter Darstellungen, die die 3D-Strahlungsfelder und entsprechenden Kamerapositionen von Tausenden von Flugbahnen kodieren. Anders als bei einem einzelnen Objekt variiert die effektive Kameraposition je nach Szene, daher ist es notwendig, die gültige Kameraposition für jede Szene zu kodieren.

Die zweite besteht darin, das Diffusionsmodell zu verwenden, um ein generatives Modell für die latente Darstellung zu lernen, damit es sowohl bei bedingten als auch bei bedingungslosen Argumentationsaufgaben gut modelliert werden kann. Ersteres generiert 3D-Szenen basierend auf Text- oder Bildaufforderungen, während letzteres 3D-Szenen basierend auf Kamerabahnen generiert.

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Mit 3D-Indoor-Szenen kann GAUDI neue Kamerabewegungen generieren. Wie in einigen der folgenden Beispiele enthält die Textbeschreibung Informationen zur Szene und zum Navigationspfad. Hier übernahm das Forschungsteam einen vorab trainierten RoBERTa-basierten Textencoder und nutzte dessen Zwischendarstellung, um das Diffusionsmodell anzupassen. Der erzeugte Effekt ist wie folgt: Textaufforderung: Gehen Sie in die Küche

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Textaufforderung: Los oben

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Textaufforderung: Durch den Korridor gehen

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Darüber hinaus ist GAUDI mit vortrainiertem ResNet-18 als Bildkodierer in der Lage, das Strahlungsfeld eines bestimmten Bildes abzutasten aus zufälligen Blickwinkeln beobachtet, wodurch 3D-Szenen aus Bildhinweisen erstellt werden. Bildtipps:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

3D-Szene generieren:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Bildtipp:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

3D-Szene generieren:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Forscher haben an vier verschiedenen Daten Experimente durchgeführt an einer Reihe von Modellen, einschließlich des Indoor-Scanning-Datensatzes ARKitScences, und zeigen, dass GAUDI gelernte Ansichten rekonstruieren und die Qualität bestehender Methoden erreichen kann. Selbst bei der riesigen Aufgabe, 3D-Szenen mit Hunderttausenden Bildern für Tausende Innenszenen zu erstellen, litt GAUDI nicht unter Moduskollaps oder Orientierungsproblemen.

GAUDI wird nicht nur Auswirkungen auf viele Computer-Vision-Aufgaben haben, sondern seine Fähigkeiten zur Generierung von 3D-Szenen werden auch Forschungsfeldern wie modellbasiertem Verstärkungslernen und -planung, SLAM und der Produktion von 3D-Inhalten zugute kommen.

Derzeit ist die Qualität des von GAUDI generierten Videos nicht hoch und es sind viele Artefakte zu sehen. Dieses System könnte jedoch ein guter Anfang und eine gute Grundlage für Apples fortlaufendes KI-System zum Rendern von 3D-Objekten und -Szenen sein. Es heißt, dass GAUDI auch auf Apples XR-Headsets angewendet wird, um digitale Positionen zu generieren. Du kannst dich darauf freuen~

Das obige ist der detaillierte Inhalt vonApple entwickelt „KI-Architekt' GAUDI: Erzeugt ultrarealistische 3D-Szenen basierend auf Text!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

CentOS Shutdown -Befehlszeile CentOS Shutdown -Befehlszeile Apr 14, 2025 pm 09:12 PM

Der Befehl centOS stilldown wird heruntergefahren und die Syntax wird von [Optionen] ausgeführt [Informationen]. Zu den Optionen gehören: -h das System sofort stoppen; -P schalten Sie die Leistung nach dem Herunterfahren aus; -r neu starten; -t Wartezeit. Zeiten können als unmittelbar (jetzt), Minuten (Minuten) oder als bestimmte Zeit (HH: MM) angegeben werden. Hinzugefügten Informationen können in Systemmeldungen angezeigt werden.

Was sind die Backup -Methoden für Gitlab auf CentOS? Was sind die Backup -Methoden für Gitlab auf CentOS? Apr 14, 2025 pm 05:33 PM

Backup- und Wiederherstellungsrichtlinie von GitLab im Rahmen von CentOS -System Um die Datensicherheit und Wiederherstellung der Daten zu gewährleisten, bietet GitLab on CentOS eine Vielzahl von Sicherungsmethoden. In diesem Artikel werden mehrere gängige Sicherungsmethoden, Konfigurationsparameter und Wiederherstellungsprozesse im Detail eingeführt, um eine vollständige GitLab -Sicherungs- und Wiederherstellungsstrategie aufzubauen. 1. Manuell Backup Verwenden Sie den GitLab-RakegitLab: Backup: Befehl erstellen, um die manuelle Sicherung auszuführen. Dieser Befehl unterstützt wichtige Informationen wie GitLab Repository, Datenbank, Benutzer, Benutzergruppen, Schlüssel und Berechtigungen. Die Standardsicherungsdatei wird im Verzeichnis/var/opt/gitlab/backups gespeichert. Sie können /etc /gitlab ändern

So überprüfen Sie die CentOS -HDFS -Konfiguration So überprüfen Sie die CentOS -HDFS -Konfiguration Apr 14, 2025 pm 07:21 PM

Vollständige Anleitung zur Überprüfung der HDFS -Konfiguration in CentOS -Systemen In diesem Artikel wird die Konfiguration und den laufenden Status von HDFS auf CentOS -Systemen effektiv überprüft. Die folgenden Schritte helfen Ihnen dabei, das Setup und den Betrieb von HDFs vollständig zu verstehen. Überprüfen Sie die Hadoop -Umgebungsvariable: Stellen Sie zunächst sicher, dass die Hadoop -Umgebungsvariable korrekt eingestellt ist. Führen Sie im Terminal den folgenden Befehl aus, um zu überprüfen, ob Hadoop ordnungsgemäß installiert und konfiguriert ist: Hadoopsion-Check HDFS-Konfigurationsdatei: Die Kernkonfigurationsdatei von HDFS befindet sich im/etc/hadoop/conf/verzeichnis, wobei core-site.xml und hdfs-site.xml von entscheidender Bedeutung sind. verwenden

Wie ist die GPU -Unterstützung für Pytorch bei CentOS? Wie ist die GPU -Unterstützung für Pytorch bei CentOS? Apr 14, 2025 pm 06:48 PM

Aktivieren Sie die Pytorch -GPU -Beschleunigung am CentOS -System erfordert die Installation von CUDA-, CUDNN- und GPU -Versionen von Pytorch. Die folgenden Schritte führen Sie durch den Prozess: Cuda und Cudnn Installation Bestimmen Sie die CUDA-Version Kompatibilität: Verwenden Sie den Befehl nvidia-smi, um die von Ihrer NVIDIA-Grafikkarte unterstützte CUDA-Version anzuzeigen. Beispielsweise kann Ihre MX450 -Grafikkarte CUDA11.1 oder höher unterstützen. Download und installieren Sie Cudatoolkit: Besuchen Sie die offizielle Website von Nvidiacudatoolkit und laden Sie die entsprechende Version gemäß der höchsten CUDA -Version herunter und installieren Sie sie, die von Ihrer Grafikkarte unterstützt wird. Installieren Sie die Cudnn -Bibliothek:

Detaillierte Erklärung des Docker -Prinzips Detaillierte Erklärung des Docker -Prinzips Apr 14, 2025 pm 11:57 PM

Docker verwendet Linux -Kernel -Funktionen, um eine effiziente und isolierte Anwendungsumgebung zu bieten. Sein Arbeitsprinzip lautet wie folgt: 1. Der Spiegel wird als schreibgeschützte Vorlage verwendet, die alles enthält, was Sie für die Ausführung der Anwendung benötigen. 2. Das Union File System (UnionFS) stapelt mehrere Dateisysteme, speichert nur die Unterschiede, speichert Platz und beschleunigt. 3. Der Daemon verwaltet die Spiegel und Container, und der Kunde verwendet sie für die Interaktion. 4. Namespaces und CGroups implementieren Container -Isolation und Ressourcenbeschränkungen; 5. Mehrere Netzwerkmodi unterstützen die Containerverbindung. Nur wenn Sie diese Kernkonzepte verstehen, können Sie Docker besser nutzen.

CentOS installieren MySQL CentOS installieren MySQL Apr 14, 2025 pm 08:09 PM

Die Installation von MySQL auf CentOS umfasst die folgenden Schritte: Hinzufügen der entsprechenden MySQL Yum -Quelle. Führen Sie den Befehl mySQL-server aus, um den MySQL-Server zu installieren. Verwenden Sie den Befehl mySQL_SECURE_INSTALLATION, um Sicherheitseinstellungen vorzunehmen, z. B. das Festlegen des Stammbenutzerkennworts. Passen Sie die MySQL -Konfigurationsdatei nach Bedarf an. Tune MySQL -Parameter und optimieren Sie Datenbanken für die Leistung.

So sehen Sie sich Gitlab -Protokolle unter CentOS So sehen Sie sich Gitlab -Protokolle unter CentOS Apr 14, 2025 pm 06:18 PM

Eine vollständige Anleitung zum Anzeigen von GitLab -Protokollen unter CentOS -System In diesem Artikel wird in diesem Artikel verschiedene GitLab -Protokolle im CentOS -System angezeigt, einschließlich Hauptprotokolle, Ausnahmebodi und anderen zugehörigen Protokollen. Bitte beachten Sie, dass der Log -Dateipfad je nach GitLab -Version und Installationsmethode variieren kann. Wenn der folgende Pfad nicht vorhanden ist, überprüfen Sie bitte das GitLab -Installationsverzeichnis und die Konfigurationsdateien. 1. Zeigen Sie das Hauptprotokoll an. Verwenden Sie den folgenden Befehl, um die Hauptprotokolldatei der GitLabRails-Anwendung anzuzeigen: Befehl: Sudocat/var/log/gitlab/gitlab-rails/production.log Dieser Befehl zeigt das Produkt an

So wählen Sie eine Gitlab -Datenbank in CentOS aus So wählen Sie eine Gitlab -Datenbank in CentOS aus Apr 14, 2025 pm 05:39 PM

Bei der Installation und Konfiguration von GitLab in einem CentOS -System ist die Auswahl der Datenbank von entscheidender Bedeutung. GitLab ist mit mehreren Datenbanken kompatibel, aber PostgreSQL und MySQL (oder MariADB) werden am häufigsten verwendet. Dieser Artikel analysiert Datenbankauswahlfaktoren und enthält detaillierte Installations- und Konfigurationsschritte. Datenbankauswahlhandbuch Bei der Auswahl einer Datenbank müssen Sie die folgenden Faktoren berücksichtigen: PostgreSQL: Die Standarddatenbank von GitLab ist leistungsstark, hat eine hohe Skalierbarkeit, unterstützt komplexe Abfragen und Transaktionsverarbeitung und ist für große Anwendungsszenarien geeignet. MySQL/Mariadb: Eine beliebte relationale Datenbank, die in Webanwendungen häufig verwendet wird, mit einer stabilen und zuverlässigen Leistung. MongoDB: NoSQL -Datenbank, spezialisiert auf

See all articles