3D-Bearbeitung spielt in Bereichen wie Spielen und virtueller Realität eine wichtige Rolle. Die bisherige 3D-Bearbeitung litt jedoch unter Problemen wie langem Zeitaufwand und schlechter Steuerbarkeit, was die Anwendung auf tatsächliche Szenen erschwerte. Kürzlich haben die Nanyang Technological University, die Tsinghua University und SenseTime einen neuen 3D-Bearbeitungsalgorithmus, GaussianEditor, vorgeschlagen, der erstmals eine kontrollierbare und abwechslungsreiche Bearbeitung von 3D-Szenen in 2–7 Minuten ermöglicht und damit frühere 3D-Bearbeitungsarbeiten völlig übertrifft.
In den letzten Jahren konzentrierte sich die Forschung im Bereich der 3D-Bearbeitung generell auf neuronale Strahlungsfelder (NeRF). Dies liegt daran, dass NeRF nicht nur eine 3D-Szenenmodellierung mit einem hohen Maß an Genauigkeit durchführen kann, sondern seine impliziten Eigenschaften auch die Skalierbarkeit erheblich verbessern, was erhebliche Vorteile gegenüber herkömmlichen Punktwolken- und Netzmethoden bietet. Allerdings ist NeRF zur Kodierung von Szenendaten auf hochdimensionale mehrschichtige Perzeptronnetzwerke (MLP) angewiesen, was auch gewisse Einschränkungen mit sich bringt. Dies erschwert die direkte Änderung bestimmter Teile einer Szene und erhöht die Komplexität von Aufgaben wie Bildwiederherstellung und Szenenkomposition. Diese Komplexität wirkt sich nicht nur auf den Trainingsprozess aus, sondern schränkt auch seinen Einsatz in praktischen Anwendungen ein.
GaussianEditor Um die oben genannten Probleme zu lösen, wählte es einen neuen Ansatz und wählte Gaußsches Sputtern als 3D-Darstellung. Gaußsches Splatting ist eine neue Art der 3D-Darstellung, die vor einem halben Jahr vorgeschlagen wurde. Diese Darstellung hat NeRF in vielen 3D-Aufgaben wie der 3D- und 4D-Rekonstruktion übertroffen. Sie hat im 3D-Bereich sofort große Aufmerksamkeit erregt und ist eine davon die größten Durchbrüche im 3D-Bereich in diesem Jahr. Gaussian Splatting hat hervorragende Aussichten und Potenzial, und GaussianEditor ist der erste, der die Bearbeitung dieser 3D-Darstellung implementiert. Das Projekt ist Open Source und bietet eine WebUI-Schnittstelle zum einfachen Erlernen und Verwenden.
Obwohl Gaussian Gaussian Splatting verfügt über einen effizienten Rendering-Algorithmus, dessen Bearbeitung als Anzeigedarstellung jedoch erhebliche Herausforderungen mit sich bringt. Ein großes Problem ist der Mangel an effizienten Methoden zur genauen Identifizierung von Bearbeitungszielen, die für eine präzise und kontrollierbare Bearbeitung von entscheidender Bedeutung sind. Darüber hinaus hat sich gezeigt, dass die Optimierung des Gaußschen Sprühens (GS) unter Verwendung hochstochastischer generativer Führung, wie beispielsweise generativer Diffusionsmodelle wie Stable Diffusion, erhebliche Herausforderungen mit sich bringt. Dies kann daran liegen, dass GS im Gegensatz zur impliziten Darstellung der Pufferung neuronaler Netzwerke direkt von der Zufälligkeit des Verlusts beeinflusst wird. Diese direkte Exposition führt zu instabilen Aktualisierungen und die Eigenschaften von Gaußschen Punkten ändern sich direkt während des Trainings. Darüber hinaus kann jeder Trainingsschritt von GS die Aktualisierung einer großen Anzahl von Gaußschen Punkten beinhalten, und dieser Prozess verfügt nicht über einen Puffermechanismus im Stil eines neuronalen Netzwerks. Diese Probleme führen zu einer übermäßigen Fluidität von GS und behindern seine Konvergenz zu guten Ergebnissen wie der impliziten Darstellung im Training ) präzise Steuerung. Die Gaußsche semantische Verfolgung kann immer Gaußsche Punkte identifizieren, die während des Trainingsprozesses bearbeitet werden müssen. Dies unterscheidet sich von herkömmlichen 3D-Bearbeitungsmethoden, die häufig auf statischen 2D- oder 3D-Masken basieren. Da sich die Geometrie und das Erscheinungsbild des 3D-Modells während des Trainings ändern, werden diese Masken nach und nach unwirksam. Die gaußsche semantische Verfolgung ermöglicht die Verfolgung während des gesamten Trainingsprozesses, indem 2D-Segmentierungsmasken auf 3D-Gauß-Punkte projiziert und jedem Gauß-Punkt semantische Beschriftungen zugewiesen werden. Da sich die Gaußschen Punkte während des Trainings ändern, ermöglichen diese semantischen Bezeichnungen die Verfolgung spezifischer Gaußscher Zielpunkte. Der Gaußsche semantische Tracking-Algorithmus stellt sicher, dass nur Zielbereiche geändert werden, was eine präzise und kontrollierte Bearbeitung ermöglicht.
Der rote Bereich im Bild unten ist der verfolgte Zielbereich. Der semantische Trackingbereich wird mit dem Trainingsprozess dynamisch aktualisiert, um seine Wirksamkeit sicherzustellen.
Um die große Herausforderung des Gaußschen Splattings (GS) zu bewältigen, bei dem es schwierig ist, gute Ergebnisse zu erzielen, wenn es stark zufällig generiert wird, übernimmt GaussinEditor außerdem eine neue GS-Darstellung: Hierarchisches Gaußsches Splatting (HGS). In HGS werden Gaußsche Punkte basierend auf ihrer Verdichtungsreihenfolge während des Trainings in verschiedene Generationen eingeteilt. Gaußsche Punkte, die bei früheren Verdichtungsprozessen entstanden sind, gelten als ältere Generationen und unterliegen strengeren Beschränkungen mit dem Ziel, ihren ursprünglichen Zustand beizubehalten und ihre Mobilität zu verringern. Im Gegensatz dazu werden Gaußsche Punkte, die in späteren Stadien gebildet werden, als jüngere Generationen behandelt und unterliegen weniger oder keinen Einschränkungen zur Verbesserung ihrer Fitness. Das Design von HGS reguliert effektiv die Mobilität von GS, indem es älteren Generationen Einschränkungen auferlegt und gleichzeitig die Flexibilität neuerer Generationen beibehält. Dieser Ansatz ermöglicht eine kontinuierliche Optimierung in Richtung besserer Ergebnisse, indem die Pufferfunktion in der impliziten Darstellung simuliert wird, die durch neuronale Netze implementiert wird Darstellung. Im Hinblick auf die Ziellöschung entwickelte das Team einen speziellen lokalen Reparaturalgorithmus, der Artefakte an der Schnittstelle zwischen Objekt und Szene effektiv eliminiert. Was das Hinzufügen von Zielen betrifft, kann GaussianEditor basierend auf einer vom Benutzer bereitgestellten Textaufforderung und 2D-Maske bestimmte Ziele zu bestimmten Bereichen hinzufügen. GaussianEditor generiert zunächst mit Hilfe des 2D-Bild-Inpainting-Algorithmus ein Einzelansichtsbild des hinzuzufügenden Objekts. Dieses Bild wird dann mithilfe des Image to 3D-Algorithmus in ein 3D-GS umgewandelt. Abschließend wird das Ziel in die Gaußsche Szene integriert.
In Vergleichsexperimenten übertraf GaussianEditor frühere Arbeiten deutlich in Bezug auf visuelle Qualität, quantitative Indikatoren, Kontrollierbarkeit und Generierungsgeschwindigkeit vorgeschlagene Gaußsche semantische Verfolgung und hierarchische Gaußsche Darstellung
GaussianEditor ist ein fortschrittlicher 3D-Bearbeitungsalgorithmus, der sich auf die flexible und schnelle Bearbeitung von 3D-Szenen konzentriert und erstmals einen Editor für Gaußsches Sputtern bietet.
Zu den Hauptmerkmalen dieses Algorithmus gehören:
Gaußsche semantische Verfolgung
: Er kann kontinuierlich Gaußsche Punkte identifizieren, die während des Trainingsprozesses bearbeitet werden müssen, und stellt so sicher, dass nur der Zielbereich bearbeitet wird.
Hierarchisches Gaußsches Splatting (HGS): Dies ist eine neue GS-Darstellung, die die Fluidität von GS-Szenen effektiv verwaltet, indem sie eine hierarchische Struktur zwischen Gaußschen Punkten aufbaut, die in verschiedenen Trainingsphasen gebildet werden, und die Pufferfunktion von Neuronen simuliert Netzwerke in impliziten Darstellungen.
Algorithmus zum Hinzufügen und Löschen von 3D-Szenen
: GaussianEditor hat speziell einen Algorithmus zum Hinzufügen und Löschen von 3D-Szenen für GS entwickelt und entworfen, mit dem bestimmte Objekte effizient aus der Szene entfernt oder hinzugefügt werden können.
Das obige ist der detaillierte Inhalt vonMachen Sie die 3D-Bearbeitung so einfach wie PS: Der neue Algorithmus GaussianEditor kann das Hinzufügen, Löschen und Ändern von 3D-Szenen in wenigen Minuten abschließen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!