Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen-KI-php.cn

Heim

Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen

PHPz

Jun 16, 2024 pm 10:50 PM

产业

Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen

Die AIxiv-Kolumne dieser Website ist eine Kolumne, die akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail-Adresse: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com.

Im Forschungsfeld der generativen 3D-Modellierung basieren die aktuellen beiden Hauptkategorien von 3D-Darstellungsmethoden entweder auf impliziten Decodern mit unzureichenden Anpassungsfähigkeiten oder es fehlen klar definierte räumliche Strukturen und sie sind schwer in das Mainstream-3D zu integrieren Diffusionstechnologien. Forscher der University of Science and Technology of China, der Tsinghua University und Microsoft Research Asia schlugen GaussianCube vor, eine explizit strukturierte 3D-Darstellung mit leistungsstarken Anpassungsfunktionen, die nahtlos auf aktuelle gängige 3D-Diffusionsmodelle angewendet werden kann.

GaussianCube beginnt mit einem neuartigen dichtebeschränkten Gaußschen Anpassungsalgorithmus, der eine hochpräzise Anpassung von 3D-Assets ermöglicht und gleichzeitig die Verwendung einer festen Anzahl freier Gaußscher Funktionen gewährleistet. Diese Gaußschen Werte werden dann mithilfe eines optimalen Transportalgorithmus in ein vordefiniertes Voxelgitter neu angeordnet. Dank der strukturellen Eigenschaften von GaussianCube können Forscher das standardmäßige 3D-U-Net direkt als Backbone-Netzwerk für die Diffusionsmodellierung verwenden, ohne dass ein komplexes Netzwerkdesign erforderlich ist.

Noch wichtiger ist, dass der in diesem Artikel vorgeschlagene neue Anpassungsalgorithmus die Kompaktheit der Darstellung erheblich verbessert. Wenn die Anpassungsqualität der 3D-Darstellung ähnlich ist, beträgt die Anzahl der erforderlichen Parameter nur ein Zehntel oder ein Hundertstel des Parameterbetrags. Diese Kompaktheit reduziert die Komplexität der generativen 3D-Modellierung erheblich. Forscher haben umfangreiche Experimente zur bedingungslosen und bedingten Generierung von 3D-Objekten, zur Erstellung digitaler Avatare und zur Text-zu-3D-Inhaltssynthese durchgeführt.

Numerische Ergebnisse zeigen, dass GaussianCube eine Leistungsverbesserung von bis zu 74 % im Vergleich zum vorherigen Basisalgorithmus erreicht. Wie unten gezeigt, ist GaussianCube nicht nur in der Lage, hochwertige 3D-Assets zu generieren, sondern bietet auch äußerst attraktive visuelle Effekte, was sein großes Potenzial als universelle Darstellung für die 3D-Generierung voll unter Beweis stellt. Abbildung 1. Unbedingt generierte Ergebnisse. Mit der Methode in diesem Artikel können hochwertige und vielfältige 3D-Modelle generiert werden.入 Abbildung 2. Das Ergebnis der digitalen Inkarnationserstellung basierend auf dem Eingabeporträt. Die Methode in diesem Artikel kann die Identitätsmerkmalsinformationen des Eingabeporträts weitgehend beibehalten und eine detaillierte Frisuren- und Kleidungsmodellierung ermöglichen.入 Abbildung 3. Die Ergebnisse der Erstellung von 3D-Assets basierend auf dem Eingabetext. Die Methode in diesem Artikel kann Ergebnisse ausgeben, die mit Textinformationen übereinstimmen, und komplexe geometrische Strukturen und detaillierte Materialien modellieren. Abbildung 4. Durch Kategoriebedingungen generierte Ergebnisse. Die in diesem Artikel generierten 3D-Assets verfügen über eine klare Semantik und hochwertige geometrische Strukturen und Materialien.

Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen

Papiername: GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling
Projekthomepage: https://gaussiancube.github.io/
Link zum Papier: https://arxiv.org/ pdf/2403.19655

Daher schlug das Forschungsteam GaussianCube vor. Hierbei handelt es sich um eine innovative dreidimensionale Darstellungsmethode, die sowohl strukturiert als auch vollständig explizit ist und leistungsstarke Anpassungsmöglichkeiten bietet. Die in diesem Artikel vorgestellte Methode stellt zunächst eine hochgenaue Anpassung mit einer festen Anzahl freier Gauß-Funktionen sicher und organisiert diese Gauß-Funktionen dann effizient in einem strukturierten Voxelgitter. Diese explizite und strukturierte Darstellung ermöglicht es Forschern, standardmäßige 3D-Netzwerkarchitekturen wie U-Net nahtlos zu übernehmen, ohne dass komplexe und angepasste Netzwerke erforderlich sind, die bei der Verwendung unstrukturierter oder implizit dekodierter Darstellungen erforderlich sind.

Gleichzeitig behält die strukturierte Organisation durch den optimalen Übertragungsalgorithmus die räumliche Strukturbeziehung zwischen benachbarten Gaußschen Kerneln weitestgehend bei, sodass Forscher nur mit klassischen 3D-Faltungsnetzwerken Merkmale effizient extrahieren können. Noch wichtiger ist, dass angesichts der Ergebnisse früherer Studien, dass Diffusionsmodelle beim Umgang mit hochdimensionalen Datenverteilungen eine schlechte Leistung erbringen, der in diesem Artikel vorgeschlagene GaussianCube die Anzahl der erforderlichen Parameter erheblich reduziert und gleichzeitig eine qualitativ hochwertige Rekonstruktion aufrechterhält, was das Problem erheblich erleichtert. Es beseitigt den Druck von Diffusionsmodellen auf die Verteilungsmodellierung und bringt erhebliche Modellierungsfunktionen und Effizienzverbesserungen in den Bereich der generativen 3D-Modellierung.

Methode

Das Papier besteht aus zwei Hauptphasen: der Darstellungskonstruktion und der dreidimensionalen Verbreitung. In der Darstellungskonstruktionsphase wird bei einem Multi-View-Rendering eines 3D-Assets eine dichtebeschränkte Gauß-Anpassung durchgeführt, um einen 3D-Gauß-Wert mit einer festen Zahl zu erhalten. Anschließend wird der dreidimensionale Gaussian durch optimierte Übertragung in einen GaussianCube strukturiert. In der 3D-Diffusionsphase trainierten die Forscher das 3D-Diffusionsmodell, um GaussianCubes aus Gaußschem Rauschen zu erzeugen.

^{um Darstellungen für jedes 3D-Asset zu erstellen, die für die generative Modellierung geeignet sind. In Anbetracht der Tatsache, dass das generative Feld häufig eine einheitliche feste Länge der modellierten Daten erfordert, führt die adaptive Dichtesteuerung im ursprünglichen 3DGS-Anpassungsalgorithmus dazu, dass unterschiedliche Anzahlen von Gaußschen Kerneln zum Anpassen verschiedener Objekte verwendet werden, was zu Problemen bei der generativen Modellierung führt. Eine sehr einfache Lösung wäre, einfach die adaptive Dichtekontrolle zu entfernen, aber die Forscher stellten fest, dass dies die Genauigkeit der Anpassung erheblich beeinträchtigte. In diesem Artikel wird ein neuartiger Dichtebeschränkungsanpassungsalgorithmus vorgeschlagen, der die Beschneidungsoperation in der ursprünglichen adaptiven Dichtesteuerung beibehält, aber eine neue Einschränkungsverarbeitung für die Aufteilungs- und Klonoperationen durchführt.}

Unter der Annahme, dass die aktuelle Iteration

Gaußsche Operatoren enthält, identifizieren die Forscher Kandidaten für Teilungs- oder Klonierungsoperationen, indem sie diejenigen Gaußschen Operatoren auswählen, deren Gradientengröße an der Position im Blickpunktraum einen vordefinierten Schwellenwert τ überschreitet, und die Anzahl dieser Kandidaten wird als markiert

. Um ein Überschreiten des vordefinierten maximalen

-Gauß-Operators zu verhindern, werden

-Gauß-Operator mit dem größten räumlichen Positionsgradienten des Blickwinkels aus den Kandidaten für die Aufteilung oder das Klonen ausgewählt. Nach Abschluss des Anpassungsprozesses füllten die Forscher ihn mit einem Gaußschen Wert von α=0, um die Zielanzahl
zu erreichen, ohne die Rendering-Ergebnisse zu beeinträchtigen. Dank dieser Strategie kann eine qualitativ hochwertige Darstellung mit mehreren Größenordnungen weniger Parametern im Vergleich zu bestehenden Arbeiten ähnlicher Qualität erreicht werden, wodurch die Modellierungsschwierigkeiten von Diffusionsmodellen erheblich reduziert werden.

^{Daten. Zu diesem Zweck schlugen Forscher vor, Gaußsche Gleichungen in ein vordefiniertes strukturiertes Voxelgitter abzubilden, um den Gaußschen Gleichungen eine klare räumliche Struktur zu verleihen. Intuitiv besteht das Ziel dieses Schritts darin, jede Gaußsche Funktion in ein Voxel zu „verschieben“ und gleichzeitig die räumliche Nachbarschaft der Gaußschen Funktion so weit wie möglich beizubehalten.}

Die Forscher modellierten es als optimales Übertragungsproblem, verwendeten den Jonker-Volgenant-Algorithmus, um die entsprechende Zuordnungsbeziehung zu erhalten, und organisierten dann die Gaußschen Operatoren gemäß der optimalen Übertragungslösung in entsprechende Voxel, um GaussianCube zu erhalten, und ersetzten die Position des ursprünglichen Gaußschen mit dem Versatz des aktuellen Voxelzentrums, um den Lösungsraum des Diffusionsmodells zu reduzieren. Die endgültige GaussianCube-Darstellung ist nicht nur strukturiert, sondern behält auch die strukturelle Beziehung zwischen benachbarten Gaußschen Operatoren weitestgehend bei, was eine starke Unterstützung für eine effiziente Merkmalsextraktion für die generative 3D-Modellierung bietet.

In der dreidimensionalen Diffusionsphase verwendet dieser Artikel ein dreidimensionales Diffusionsmodell, um die Verteilung von GaussianCube zu modellieren. Dank der räumlich strukturierten Organisation von GaussianCube reicht die standardmäßige 3D-Faltung aus, um Merkmale benachbarter Gauß-Funktionen effektiv zu extrahieren und zu aggregieren, ohne dass komplexe Netzwerk- oder Trainingsdesigns erforderlich sind. Daher nutzten die Forscher die standardmäßige U-Net-Netzwerkverbreitung und ersetzten die ursprünglichen 2D-Operatoren (einschließlich Faltung, Aufmerksamkeit, Upsampling und Downsampling) direkt durch ihre 3D-Implementierungen.

Das dreidimensionale Diffusionsmodell dieses Artikels unterstützt auch eine Vielzahl von Bedingungssignalen zur Steuerung des Generierungsprozesses, einschließlich der Generierung von Kategoriebeschriftungsbedingungen, der Erstellung digitaler Avatare basierend auf Bildbedingungen und der Generierung dreidimensionaler digitaler Assets basierend auf Bildbedingungen Text. Die auf multimodalen Bedingungen basierende Generierungsfähigkeit erweitert den Anwendungsbereich des Modells erheblich und bietet ein leistungsstarkes Werkzeug für die zukünftige Erstellung von 3D-Inhalten.

Experimentelle Ergebnisse

Die Forscher überprüften zunächst die Anpassungsfähigkeit von GaussianCube anhand des ShapeNet-Autodatensatzes. Experimentelle Ergebnisse zeigen, dass GaussianCube im Vergleich zu Basismethoden eine hochpräzise dreidimensionale Objektanpassung mit der schnellsten Geschwindigkeit und der geringsten Anzahl von Parametern erreichen kann.

Tabelle 1. Numerischer Vergleich verschiedener dreidimensionaler Darstellungen auf ShapeNet Car hinsichtlich räumlicher Struktur, Anpassungsqualität, relativer Anpassungsgeschwindigkeit und Menge der verwendeten Parameter.

∗

zeigt an, dass verschiedene Objekte implizite Feature-Decoder gemeinsam nutzen. Alle Methoden werden mit 30.000 Iterationen ausgewertet. Abbildung 8. Visueller Vergleich der Anpassungsmöglichkeiten verschiedener 3D-Darstellungen auf ShapeNet Car. ∗ zeigt an, dass verschiedene Objekte implizite Feature-Decoder gemeinsam nutzen. Alle Methoden werden mit 30.000 Iterationen ausgewertet. Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen

^{Die Forscher überprüften dann die Generierungsfähigkeit des GaussianCube-basierten Diffusionsmodells anhand einer großen Anzahl von Datensätzen, darunter ShapeNet, OmniObject3D, synthetische digitale Avatar-Datensätze und Objaverse-Datensätze. Experimentelle Ergebnisse zeigen, dass unser Modell führende Ergebnisse bei der bedingungslosen und kategoriebedingten Objektgenerierung, der Erstellung digitaler Avatare und der Text-zu-3D-Synthese erzielt, die von numerischen Metriken bis hin zur visuellen Qualität reicht. Insbesondere erreicht GaussianCube eine Leistungssteigerung von bis zu 74 % im Vergleich zum vorherigen Basisalgorithmus.}

Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen

Tabelle 2. Quantitativer Vergleich der bedingungslosen Generierung auf ShapeNet Car, Chair und der kategoriebedingten Generierung auf OmniObject3D.

^{Abbildung 9. Qualitativer Vergleich der bedingungslosen Generierung auf Netzwagen, Stuhl. Mit der Methode in diesem Artikel können genaue Geometrie und detaillierte Materialien generiert werden. Abbildung 10. Qualitativer Vergleich der Kategoriebedingungsgenerierung auf OmniObject3D. Mit dieser Methode können komplexe Objekte mit klarer Semantik generiert werden. Tabelle 3. Quantitativer Vergleich der Erstellung digitaler Avatare basierend auf Eingabeporträts. Abbildung 11. Qualitativer Vergleich der Erstellung digitaler Avatare basierend auf dem Eingabeporträt. Mit der Methode in diesem Artikel können die Identitätsmerkmale, Ausdrücke, Accessoires und Haardetails des Eingabeporträts genauer wiederhergestellt werden.}

Die vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen

^{Tabelle 4. Quantitativer Vergleich der Erstellung von 3D-Assets basierend auf Eingabetext. Die Inferenzzeit wurde mit einem einzelnen A100 getestet. Shap-E und LGM erzielten ähnliche CLIP-Scores wie die Methode in diesem Artikel, verwendeten jedoch jeweils Millionen von Trainingsdaten (in diesem Artikel wurden nur 100.000 dreidimensionale Daten für das Training verwendet) und zuvor ein zweidimensionales Vincentian-Graph-Diffusionsmodell. Abbildung 12. Qualitativer Vergleich der Erstellung von 3D-Assets basierend auf Eingabetext. Mit der Methode in diesem Artikel kann eine qualitativ hochwertige 3D-Asset-Generierung basierend auf dem Eingabetext erreicht werden.}

Das obige ist der detaillierte Inhalt vonDie vielversprechendste Folge für hochwertige 3D-Generierung? GaussianCube übertrifft NeRF in der 3D-Generierung um Längen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

<🎜>: Wachsen Sie einen Garten - Komplette Mutationsführer

3 Wochen vor By DDD

<🎜>: Bubble Gum Simulator Infinity - So erhalten und verwenden Sie Royal Keys

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Wie kann ich KB5055612 in Windows 10 nicht installieren?

3 Wochen vor By DDD

Nordhold: Fusionssystem, erklärt

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Flüstern des Hexenbaum

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Java-Tutorial

1666

CakePHP-Tutorial

1426

Laravel-Tutorial

1328

PHP-Tutorial

1273

C#-Tutorial

1253

Related knowledge

Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden Aug 09, 2024 pm 04:01 PM

Aber vielleicht kann er den alten Mann im Park nicht besiegen? Die Olympischen Spiele in Paris sind in vollem Gange und Tischtennis hat viel Aufmerksamkeit erregt. Gleichzeitig haben Roboter auch beim Tischtennisspielen neue Durchbrüche erzielt. Gerade hat DeepMind den ersten lernenden Roboteragenten vorgeschlagen, der das Niveau menschlicher Amateurspieler im Tischtennis-Wettkampf erreichen kann. Papieradresse: https://arxiv.org/pdf/2408.03906 Wie gut ist der DeepMind-Roboter beim Tischtennisspielen? Vermutlich auf Augenhöhe mit menschlichen Amateurspielern: Sowohl Vorhand als auch Rückhand: Der Gegner nutzt unterschiedliche Spielstile, und auch der Roboter hält aus: Aufschlagannahme mit unterschiedlichem Spin: Allerdings scheint die Intensität des Spiels nicht so intensiv zu sein wie Der alte Mann im Park. Für Roboter, Tischtennis

Die erste mechanische Klaue! Yuanluobao trat auf der Weltroboterkonferenz 2024 auf und stellte den ersten Schachroboter vor, der das Haus betreten kann Aug 21, 2024 pm 07:33 PM

Am 21. August fand in Peking die Weltroboterkonferenz 2024 im großen Stil statt. Die Heimrobotermarke „Yuanluobot SenseRobot“ von SenseTime hat ihre gesamte Produktfamilie vorgestellt und kürzlich den Yuanluobot AI-Schachspielroboter – Chess Professional Edition (im Folgenden als „Yuanluobot SenseRobot“ bezeichnet) herausgebracht und ist damit der weltweit erste A-Schachroboter für heim. Als drittes schachspielendes Roboterprodukt von Yuanluobo hat der neue Guoxiang-Roboter eine Vielzahl spezieller technischer Verbesserungen und Innovationen in den Bereichen KI und Maschinenbau erfahren und erstmals die Fähigkeit erkannt, dreidimensionale Schachfiguren aufzunehmen B. durch mechanische Klauen an einem Heimroboter, und führen Sie Mensch-Maschine-Funktionen aus, z. B. Schach spielen, jeder spielt Schach, Überprüfung der Notation usw.

Claude ist auch faul geworden! Netizen: Lernen Sie, sich einen Urlaub zu gönnen Sep 02, 2024 pm 01:56 PM

Der Schulstart steht vor der Tür und nicht nur die Schüler, die bald ins neue Semester starten, sollten auf sich selbst aufpassen, sondern auch die großen KI-Modelle. Vor einiger Zeit war Reddit voller Internetnutzer, die sich darüber beschwerten, dass Claude faul werde. „Sein Niveau ist stark gesunken, es kommt oft zu Pausen und sogar die Ausgabe wird sehr kurz. In der ersten Woche der Veröffentlichung konnte es ein komplettes 4-seitiges Dokument auf einmal übersetzen, aber jetzt kann es nicht einmal eine halbe Seite ausgeben.“ !

Auf der Weltroboterkonferenz wurde dieser Haushaltsroboter, der „die Hoffnung auf eine zukünftige Altenpflege' in sich trägt, umzingelt Aug 22, 2024 pm 10:35 PM

Auf der World Robot Conference in Peking ist die Präsentation humanoider Roboter zum absoluten Mittelpunkt der Szene geworden. Am Stand von Stardust Intelligent führte der KI-Roboterassistent S1 drei große Darbietungen mit Hackbrett, Kampfkunst und Kalligraphie auf Ein Ausstellungsbereich, der sowohl Literatur als auch Kampfkunst umfasst, zog eine große Anzahl von Fachpublikum und Medien an. Durch das elegante Spiel auf den elastischen Saiten demonstriert der S1 eine feine Bedienung und absolute Kontrolle mit Geschwindigkeit, Kraft und Präzision. CCTV News führte einen Sonderbericht über das Nachahmungslernen und die intelligente Steuerung hinter „Kalligraphie“ durch. Firmengründer Lai Jie erklärte, dass hinter den seidenweichen Bewegungen die Hardware-Seite die beste Kraftkontrolle und die menschenähnlichsten Körperindikatoren (Geschwindigkeit, Belastung) anstrebt. usw.), aber auf der KI-Seite werden die realen Bewegungsdaten von Menschen gesammelt, sodass der Roboter stärker werden kann, wenn er auf eine schwierige Situation stößt, und lernen kann, sich schnell weiterzuentwickeln. Und agil

Bekanntgabe der ACL 2024 Awards: Eines der besten Papers zum Thema Oracle Deciphering von HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Bei dieser ACL-Konferenz haben die Teilnehmer viel gewonnen. Die sechstägige ACL2024 findet in Bangkok, Thailand, statt. ACL ist die führende internationale Konferenz im Bereich Computerlinguistik und Verarbeitung natürlicher Sprache. Sie wird von der International Association for Computational Linguistics organisiert und findet jährlich statt. ACL steht seit jeher an erster Stelle, wenn es um akademischen Einfluss im Bereich NLP geht, und ist außerdem eine von der CCF-A empfohlene Konferenz. Die diesjährige ACL-Konferenz ist die 62. und hat mehr als 400 innovative Arbeiten im Bereich NLP eingereicht. Gestern Nachmittag gab die Konferenz den besten Vortrag und weitere Auszeichnungen bekannt. Diesmal gibt es 7 Best Paper Awards (zwei davon unveröffentlicht), 1 Best Theme Paper Award und 35 Outstanding Paper Awards. Die Konferenz verlieh außerdem drei Resource Paper Awards (ResourceAward) und einen Social Impact Award (

Das Team von Li Feifei schlug ReKep vor, um Robotern räumliche Intelligenz zu verleihen und GPT-4o zu integrieren Sep 03, 2024 pm 05:18 PM

Tiefe Integration von Vision und Roboterlernen. Wenn zwei Roboterhände reibungslos zusammenarbeiten, um Kleidung zu falten, Tee einzuschenken und Schuhe zu packen, gepaart mit dem humanoiden 1X-Roboter NEO, der in letzter Zeit für Schlagzeilen gesorgt hat, haben Sie vielleicht das Gefühl: Wir scheinen in das Zeitalter der Roboter einzutreten. Tatsächlich sind diese seidigen Bewegungen das Produkt fortschrittlicher Robotertechnologie + exquisitem Rahmendesign + multimodaler großer Modelle. Wir wissen, dass nützliche Roboter oft komplexe und exquisite Interaktionen mit der Umgebung erfordern und die Umgebung als Einschränkungen im räumlichen und zeitlichen Bereich dargestellt werden kann. Wenn Sie beispielsweise möchten, dass ein Roboter Tee einschenkt, muss der Roboter zunächst den Griff der Teekanne ergreifen und sie aufrecht halten, ohne den Tee zu verschütten, und ihn dann sanft bewegen, bis die Öffnung der Kanne mit der Öffnung der Tasse übereinstimmt , und neigen Sie dann die Teekanne in einem bestimmten Winkel. Das

Distributed Artificial Intelligence Conference DAI 2024 Call for Papers: Agent Day, Richard Sutton, der Vater des Reinforcement Learning, wird teilnehmen! Yan Shuicheng, Sergey Levine und DeepMind-Wissenschaftler werden Grundsatzreden halten Aug 22, 2024 pm 08:02 PM

Einleitung zur Konferenz Mit der rasanten Entwicklung von Wissenschaft und Technologie ist künstliche Intelligenz zu einer wichtigen Kraft bei der Förderung des sozialen Fortschritts geworden. In dieser Zeit haben wir das Glück, die Innovation und Anwendung der verteilten künstlichen Intelligenz (DAI) mitzuerleben und daran teilzuhaben. Verteilte Künstliche Intelligenz ist ein wichtiger Zweig des Gebiets der Künstlichen Intelligenz, der in den letzten Jahren immer mehr Aufmerksamkeit erregt hat. Durch die Kombination des leistungsstarken Sprachverständnisses und der Generierungsfähigkeiten großer Modelle sind plötzlich Agenten aufgetaucht, die auf natürlichen Sprachinteraktionen, Wissensbegründung, Aufgabenplanung usw. basieren. AIAgent übernimmt das große Sprachmodell und ist zu einem heißen Thema im aktuellen KI-Kreis geworden. Au

Hongmeng Smart Travel S9 und die umfassende Einführungskonferenz für neue Produkte wurden gemeinsam mit einer Reihe neuer Blockbuster-Produkte veröffentlicht Aug 08, 2024 am 07:02 AM

Heute Nachmittag begrüßte Hongmeng Zhixing offiziell neue Marken und neue Autos. Am 6. August veranstaltete Huawei die Hongmeng Smart Xingxing S9 und die Huawei-Konferenz zur Einführung neuer Produkte mit umfassendem Szenario und brachte die Panorama-Smart-Flaggschiff-Limousine Xiangjie S9, das neue M7Pro und Huawei novaFlip, MatePad Pro 12,2 Zoll, das neue MatePad Air und Huawei Bisheng mit Mit vielen neuen Smart-Produkten für alle Szenarien, darunter die Laserdrucker der X1-Serie, FreeBuds6i, WATCHFIT3 und der Smart Screen S5Pro, von Smart Travel über Smart Office bis hin zu Smart Wear baut Huawei weiterhin ein Smart-Ökosystem für alle Szenarien auf, um Verbrauchern ein Smart-Erlebnis zu bieten Internet von allem. Hongmeng Zhixing: Huawei arbeitet mit chinesischen Partnern aus der Automobilindustrie zusammen, um die Modernisierung der Smart-Car-Industrie voranzutreiben

See all articles