Inhaltsverzeichnis
Methode
Heim Technologie-Peripheriegeräte KI Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Apr 17, 2024 pm 11:40 PM
git ai 模型

Multitasking-Roboterlernen ist für den Umgang mit vielfältigen und komplexen Szenarien von großer Bedeutung. Aktuelle Methoden sind jedoch durch Leistungsprobleme und Schwierigkeiten beim Sammeln von Trainingsdatensätzen begrenzt.

Dieses Papier schlägt GeRM (Generic Robot Model) vor, bei dem Forscher Offline-Verstärkungslernen nutzen, um Datennutzungsstrategien zu optimieren, aus Demonstrationen und suboptimalen Daten zu lernen und so die Grenzen menschlicher Demonstrationen zu überwinden.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Autoren: Song Wenxuan, Zhao Han, Ding Pengxiang, Cui Can, Lu Shangke, Fan Yaning, Wang Donglin

Autor: West Lake University, Zhejiang University

Papieradresse: https: //arxiv.org/abs/2403.13358

Projektadresse: https://songwxuan.github.io/GeRM/

Dann wird ein Transformer-basiertes Vision-Language-Action-Modell zur multimodalen Verarbeitung verwendet Eingabe- und Ausgabeaktionen.

Durch die Einführung einer Experten-Hybridstruktur erreicht GeRM eine schnellere Inferenzgeschwindigkeit und eine höhere Gesamtkapazität des Modells. Dadurch wird das Problem des begrenzten Volumens der Verstärkungslernparameter gelöst, die Modellleistung beim Lernen mit mehreren Aufgaben verbessert und gleichzeitig die Kostenberechnung gesteuert.

Durch eine Reihe von Experimenten wurde nachgewiesen, dass GeRM bei allen Aufgaben andere Methoden übertrifft und gleichzeitig seine Effizienz in den Trainings- und Inferenzprozessen bestätigt.

Darüber hinaus stellten die Forscher auch den QUARD-Auto-Datensatz zur Verfügung, um das Training zu unterstützen. Der Aufbau dieses Datensatzes folgt dem im Artikel vorgeschlagenen neuen Paradigma der Datenautomatisierung und den Fortschritt des Multitasking-Lernens fördern.

Hauptbeiträge:

1 Zum ersten Mal ein hybrides Expertenmodell für vierbeiniges Verstärkungslernen vorgeschlagen, das auf Daten gemischter Qualität trainiert wird und das Potenzial hat, optimale Strategien zu erlernen.

2. Im Vergleich zu bestehenden Methoden zeigt GeRM eine höhere Erfolgsquote, wenn nur die Hälfte seiner eigenen Parameter aktiviert wird, und zeigt eine bessere Datennutzung während des Trainingsprozesses.

3. Schlug ein Paradigma für die vollautomatische Sammlung von Roboterdatensätzen vor und sammelte einen großen Open-Source-Datensatz.

Methode

Die GeRM-Netzwerkstruktur ist in Abbildung 1 dargestellt. Die visuell-linguistische Eingabe einschließlich Demonstrationsdaten und Fehlerdaten wird in den Decoder der 8-schichtigen Hybrid-Expertenstruktur eingegeben, nachdem sie den Encoder bzw. den Tokenizer durchlaufen hat. und generiert Aktionstoken, die schließlich in diskrete Roboteraktionsdaten umgewandelt und über die zugrunde liegende Strategie für den Roboter bereitgestellt werden.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Abbildung 1 GeRM-Netzwerkstrukturdiagramm

GeRM Decoder ist ein Transformer Decoder-Architekturmodell, bei dem das Feedforward-Netzwerk (FFN) aus einem Satz von 8 verschiedenen Expertennetzwerken ausgewählt wird.

Auf jeder Ebene wählt das Gated Network für jeden Token zwei Experten aus, die den Token verarbeiten und ihre Ergebnisse gewichtet kombinieren.

Verschiedene Experten beherrschen unterschiedliche Aufgaben/unterschiedliche Handlungsdimensionen, um Probleme in unterschiedlichen Szenarien zu lösen und erlernen so ein gemeinsames Modell über mehrere Aufgaben hinweg. Diese Architektur erweitert die Anzahl der Netzwerkparameter, während der Rechenaufwand im Wesentlichen unverändert bleibt.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Abbildung 2 Decoder-Strukturdiagramm

Wir schlagen ein automatisches Paradigma zum Sammeln multimodaler Daten von Robotern vor. Auf diese Weise haben wir QUARD-Auto erstellt, einen umfangreichen Robotikdatensatz, der eine Kombination aus Demonstrations- und suboptimalen Daten enthält. Es umfasst 5 Aufgaben und 99 Unteraufgaben mit insgesamt 257.000 Flugbahnen. Wir werden Open Source nutzen, um die Entwicklung der Robotik-Community zu fördern.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Tabelle 1 Einführung in den Datensatz

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Abbildung 3 Datenvolumenstatistik

Experimente

Wir führten eine umfassende und robuste Reihe von Experimenten durch, die alle 99 Teilaufgaben abdeckten, von denen jede sorgfältig an 400 Flugbahnen getestet wurde.

Wie in Tabelle 1 dargestellt, weist GeRM unter allen Aufgaben die höchste Erfolgsquote auf. Im Vergleich zu RT-1 und anderen GeRM-Varianten lernt es effektiv aus Daten unterschiedlicher Qualität, übertrifft andere Methoden und weist bei mehreren Aufgaben überlegene Fähigkeiten auf. Gleichzeitig gleicht das MoE-Modul Rechenkosten und Leistung aus, indem es einige Parameter während der Inferenz aktiviert.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Tabelle 2 Multitask-Vergleichsexperiment

GeRM zeigt eine lobenswerte Trainingseffizienz. Im Vergleich zu anderen Methoden erreicht GeRM mit nur wenigen Chargen einen extrem geringen Verlust und eine hohe Erfolgsquote, was die Fähigkeit von GeRM zur Optimierung von Datennutzungsstrategien unterstreicht.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Abbildung 4 Erfolgsraten-/Verluständerungskurve

GeRM hat neue Fähigkeiten in der dynamischen adaptiven Pfadplanung gezeigt. Wie im Video gezeigt, hat der vierbeinige Roboter in der Ausgangsposition ein eingeschränktes Sichtfeld und es ist schwierig, die Bewegungsrichtung zu bestimmen. Um dem Hindernis auszuweichen, wählt es zufällig eine Linkskurve.

Anschließend führt der Roboter bei fehlerhafter visueller Eingabe eine drastische Neuausrichtung durch, um sich auf das richtige Ziel außerhalb des ursprünglichen Sichtfelds auszurichten. Anschließend setzt es seinen Weg zu seinem Ziel fort und erfüllt schließlich seine Mission.

Es ist erwähnenswert, dass solche Trajektorien nicht in die Verteilung unseres Trainingsdatensatzes fallen. Dies zeigt die neuen Fähigkeiten von GeRM zur dynamischen adaptiven Pfadplanung im Kontext einer Szene, d. h. seine Fähigkeit, Entscheidungen auf der Grundlage visueller Wahrnehmung zu treffen, zukünftige Pfade zu planen und die nächsten Schritte nach Bedarf zu ändern.

Meistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor

Abbildung 5 Emergente Fähigkeit

Das obige ist der detaillierte Inhalt vonMeistern Sie 99 Untermissionen mit MoE! Die Zhejiang-Universität und andere schlugen eine neue allgemeine Roboterstrategie GeRM vor. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie man Git Commit benutzt Wie man Git Commit benutzt Apr 17, 2025 pm 03:57 PM

Git Commit ist ein Befehl, mit dem Dateien Änderungen an einem Git -Repository aufgezeichnet werden, um einen Momentaufnahme des aktuellen Status des Projekts zu speichern. So verwenden Sie dies wie folgt: Fügen Sie Änderungen in den temporären Speicherbereich hinzu, schreiben Sie eine prägnante und informative Einreichungsnachricht, um die Einreichungsnachricht zu speichern und zu beenden, um die Einreichung optional abzuschließen: Fügen Sie eine Signatur für die Einreichungs -Git -Protokoll zum Anzeigen des Einreichungsinhalts hinzu.

So löschen Sie ein Repository von Git So löschen Sie ein Repository von Git Apr 17, 2025 pm 04:03 PM

Befolgen Sie die folgenden Schritte, um ein Git -Repository zu löschen: Bestätigen Sie das Repository, das Sie löschen möchten. Lokale Löschen des Repositorys: Verwenden Sie den Befehl rm -RF, um seinen Ordner zu löschen. Löschen Sie ein Lager aus der Ferne: Navigieren Sie zu den Lagereinstellungen, suchen Sie die Option "Lager löschen" und bestätigen Sie den Betrieb.

So lösen Sie die Komplexität der WordPress -Installation und -aktualisierung mit Composer So lösen Sie die Komplexität der WordPress -Installation und -aktualisierung mit Composer Apr 17, 2025 pm 10:54 PM

Bei der Verwaltung von WordPress-Websites begegnen Sie häufig komplexe Vorgänge wie Installation, Aktualisierung und Mehrstelle. Diese Operationen sind nicht nur zeitaufwändig, sondern auch anfällig für Fehler, wodurch die Website gelähmt wird. Die Kombination des WP-Cli-Kernbefehls mit Komponist kann diese Aufgaben erheblich vereinfachen und die Effizienz und Zuverlässigkeit verbessern. In diesem Artikel wird vorgestellt, wie der Komponist verwendet wird, um diese Probleme zu lösen und die Bequemlichkeit des WordPress -Managements zu verbessern.

So fügen Sie öffentliche Schlüssel zum Git -Konto hinzu So fügen Sie öffentliche Schlüssel zum Git -Konto hinzu Apr 17, 2025 pm 02:42 PM

Wie füge ich einem Git -Konto einen öffentlichen Schlüssel hinzu? Schritt: Generieren Sie ein SSH -Schlüsselpaar. Kopieren Sie den öffentlichen Schlüssel. Fügen Sie einen öffentlichen Schlüssel in Gitlab oder GitHub hinzu. Testen Sie die SSH -Verbindung.

Wie man mit Git -Code -Konflikt umgeht Wie man mit Git -Code -Konflikt umgeht Apr 17, 2025 pm 02:51 PM

Der Code -Konflikt bezieht sich auf einen Konflikt, der auftritt, wenn mehrere Entwickler denselben Code -Stück ändern und GIT veranlassen, sich zu verschmelzen, ohne automatisch Änderungen auszuwählen. Zu den Auflösungsschritten gehören: Öffnen Sie die widersprüchliche Datei und finden Sie den widersprüchlichen Code. Führen Sie den Code manuell zusammen und kopieren Sie die Änderungen, die Sie in den Konfliktmarker halten möchten. Löschen Sie die Konfliktmarke. Änderungen speichern und einreichen.

So laden Sie GIT -Projekte auf lokale Herd herunter So laden Sie GIT -Projekte auf lokale Herd herunter Apr 17, 2025 pm 04:36 PM

Um Projekte lokal über Git herunterzuladen, befolgen Sie die folgenden Schritte: Installieren Sie Git. Navigieren Sie zum Projektverzeichnis. Klonen des Remote-Repositorys mit dem folgenden Befehl: Git Clone https://github.com/username/repository-name.git.git

Was tun, wenn der Git -Download nicht aktiv ist Was tun, wenn der Git -Download nicht aktiv ist Apr 17, 2025 pm 04:54 PM

Auflösung: Wenn die Git -Download -Geschwindigkeit langsam ist, können Sie die folgenden Schritte ausführen: Überprüfen Sie die Netzwerkverbindung und versuchen Sie, die Verbindungsmethode zu wechseln. Optimieren Sie die GIT-Konfiguration: Erhöhen Sie die Post-Puffer-Größe (GIT-Konfiguration --global http.postbuffer 524288000) und verringern Sie die Niedriggeschwindigkeitsbegrenzung (GIT-Konfiguration --global http.lowSpeedLimit 1000). Verwenden Sie einen GIT-Proxy (wie Git-Proxy oder Git-LFS-Proxy). Versuchen Sie, einen anderen Git -Client (z. B. Sourcetree oder Github Desktop) zu verwenden. Überprüfen Sie den Brandschutz

Wie löste ich das effiziente Suchproblem in PHP -Projekten? Typense hilft Ihnen, es zu erreichen! Wie löste ich das effiziente Suchproblem in PHP -Projekten? Typense hilft Ihnen, es zu erreichen! Apr 17, 2025 pm 08:15 PM

Bei der Entwicklung einer E-Commerce-Website habe ich auf ein schwieriges Problem gestoßen: Wie kann ich effiziente Suchfunktionen in großen Mengen an Produktdaten erzielen? Herkömmliche Datenbanksuche sind ineffizient und haben eine schlechte Benutzererfahrung. Nach einigen Nachforschungen entdeckte ich den Suchmaschinen-Artensense und löste dieses Problem durch seine offizielle PHP-Client-Artense-/Artense-Php, die die Suchleistung erheblich verbesserte.

See all articles