Heim Technologie-Peripheriegeräte KI Mit dem „Hund' auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Mit dem „Hund' auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

May 05, 2024 pm 01:01 PM
git 工程 dreureka

Der Roboterhund läuft gleichmäßig auf dem Yoga-Ball und sein Gleichgewicht ist ziemlich gut:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Er kann verschiedene Szenen bewältigen, egal ob es sich um einen flachen Gehweg oder einen anspruchsvollen Rasen handelt, er kann Folgendes halten:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Sogar Als Forscher einen Yogaball traten, kippte der Roboterhund nicht um:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Der Roboterhund konnte auch beim Entleeren von Ballons das Gleichgewicht halten:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Die obigen Demonstrationen erfolgen alle mit einfacher Geschwindigkeit, ohne Beschleunigungsverarbeitung.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
  • Papieradresse: https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf
  • Projekthomepage: https://github.com/eureka- Forschung/DrEureka
  • Titel des Papiers: DrEureka: Language Model Guided Sim-To-Real Transfer

Diese Forschung wurde gemeinsam von Forschern der University of Pennsylvania, NVIDIA und der University of Texas in Austin erstellt und ist vollständig Open Source. Sie schlugen DrEureka (Domain Randomized Eureka) vor, einen neuen Algorithmus, der LLM nutzt, um Belohnungsdesign und domänenrandomisierte Parameterkonfiguration zu implementieren, wodurch gleichzeitig eine Übertragung von Simulation auf Realität erreicht werden kann. Die Studie demonstriert die Fähigkeit des DrEureka-Algorithmus, neuartige Roboteraufgaben zu lösen, beispielsweise das Balancieren eines vierbeinigen Roboters und das Gehen auf einem Yogaball, ohne dass ein iteratives manuelles Design erforderlich ist.

DrEureka basiert auf Eureka, das auch zu einem der zehn besten NVIDIA-Projekte im Jahr 2023 gekürt wurde. Weitere Informationen zu Eureka finden Sie unter „Mit GPT-4 hat der Roboter gelernt, wie man Stifte dreht und Walnüsse plattiert“.

Im Zusammenfassungsteil der Arbeit erklärten die Forscher, dass die Übertragung von in Simulationen erlernten Strategien auf die reale Welt eine vielversprechende Strategie für den groß angelegten Erwerb von Roboterfähigkeiten sei. Simulation-zu-Realität-Ansätze basieren jedoch häufig auf der manuellen Gestaltung und Abstimmung von Aufgabenbelohnungsfunktionen und physikalischen Simulationsparametern, was den Prozess langsam und arbeitsintensiv macht. In diesem Artikel wird die Verwendung großer Sprachmodelle (LLMs) untersucht, um die Simulation zu einem realistischen Design zu automatisieren und zu beschleunigen.

Jim Fan, einer der Autoren des Papiers und leitender Wissenschaftler bei NVIDIA, war ebenfalls an dieser Forschung beteiligt. Zuvor gründete Nvidia unter der Leitung von Jim Fan ein KI-Labor, das sich auf verkörperte Intelligenz spezialisierte. Jim Fan sagte:

„Wir haben einem Roboterhund beigebracht, auf einem Yoga-Ball zu balancieren und zu laufen. Dies wurde vollständig in der Simulation durchgeführt und dann ohne Proben und ohne Feinabstimmung in die reale Welt übertragen und direkt ausgeführt.“

Das Gehen mit dem Yogaball ist für den Roboterhund besonders schwierig, da wir die Oberfläche des Hüpfballs nicht genau simulieren können. DrEureka kann jedoch problemlos eine große Anzahl simulierter realer Konfigurationen durchsuchen und dem Roboterhund ermöglichen um den Ball auf verschiedenen Terrains zu kontrollieren oder sogar seitwärts zu gehen!

Im Allgemeinen wird die Migration von der Simulation zur Realität durch Domänen-Randomisierung erreicht, was ein langwieriger Prozess ist, bei dem Robotikexperten jeden Parameter im Auge behalten und manuell anpassen müssen 4 Solche hochmodernen LLMs verfügen über eine Menge eingebauter physikalischer Intuition, einschließlich Reibung, Dämpfung, Steifigkeit, Schwerkraft usw. Mit GPT-4 kann DrEureka diese Parameter geschickt anpassen und seine Argumentation gut erklären 》

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Einführung in das Papier

DrEureka-Prozess ist wie folgt: Er akzeptiert Aufgaben- und Sicherheitsanweisungen und Umgebungsquellcode und führt Eureka aus, um regulierte Belohnungsfunktionen und -richtlinien zu generieren. Anschließend wird die Strategie unter verschiedenen Simulationsbedingungen getestet, um einen belohnungsbewussten physischen Prior zu erstellen, der einem LLM zugeführt wird, um einen Satz von Domänen-Randomisierungsparametern (DR) zu generieren. Abschließend wird die Richtlinie mithilfe der synthetisierten Belohnungs- und DR-Parameter für die tatsächliche Bereitstellung trainiert.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Eureka-Belohnungsdesign. Die Belohnungsdesignkomponente basiert aufgrund ihrer Einfachheit und Ausdruckskraft auf Eureka. In diesem Dokument werden jedoch einige Verbesserungen vorgestellt, um ihre Anwendbarkeit von der Simulation auf reale Umgebungen zu verbessern. Der Pseudocode lautet wie folgt:
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Belohnungsbewusste Physik vor (RAPP, belohnungsbewusste Physik vor). Sicherheitsbelohnungsfunktionen können das politische Verhalten regulieren, um Umweltentscheidungen festzulegen, reichen jedoch allein nicht aus, um einen Transfer von der Simulation in die Realität zu erreichen. Daher stellt dieses Papier einen einfachen RAPP-Mechanismus vor, um den grundlegenden Umfang von LLM einzuschränken.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
LLM wird für die Domain-Randomisierung verwendet. Angesichts des RAPP-Bereichs für jeden DR-Parameter weist der letzte Schritt von DrEureka LLM an, Domänen-Randomisierungskonfigurationen innerhalb der Grenzen des RAPP-Bereichs zu generieren. Siehe Abbildung 3 für den spezifischen Prozess:
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Diese Forschung verwendet Unitree Go1 für Experimente. Go1 ist ein kleiner vierbeiniger Roboter mit 12 Freiheitsgraden in seinen vier Beinen. In der vierbeinigen Fortbewegungsaufgabe bewertet dieser Artikel auch systematisch die Leistung von DrEureka-Richtlinien auf mehreren realen Terrains und stellt fest, dass sie robust bleiben und Richtlinien übertreffen, die mithilfe von Menschen entworfener Belohnungs- und DR-Konfigurationen trainiert wurden.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Weitere Informationen finden Sie im Originalpapier.

Das obige ist der detaillierte Inhalt vonMit dem „Hund' auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Apr 02, 2025 pm 02:06 PM

In der Bibliothek, die für den Betrieb der Schwimmpunktnummer in der GO-Sprache verwendet wird, wird die Genauigkeit sichergestellt, wie die Genauigkeit ...

Welche Bibliotheken in GO werden von großen Unternehmen entwickelt oder von bekannten Open-Source-Projekten bereitgestellt? Welche Bibliotheken in GO werden von großen Unternehmen entwickelt oder von bekannten Open-Source-Projekten bereitgestellt? Apr 02, 2025 pm 04:12 PM

Welche Bibliotheken in GO werden von großen Unternehmen oder bekannten Open-Source-Projekten entwickelt? Bei der Programmierung in Go begegnen Entwickler häufig auf einige häufige Bedürfnisse, ...

Gitee Pages statische Website -Bereitstellung fehlgeschlagen: Wie können Sie einzelne Dateien 404 Fehler beheben und beheben? Gitee Pages statische Website -Bereitstellung fehlgeschlagen: Wie können Sie einzelne Dateien 404 Fehler beheben und beheben? Apr 04, 2025 pm 11:54 PM

GitePages statische Website -Bereitstellung fehlgeschlagen: 404 Fehlerbehebung und Auflösung bei der Verwendung von Gitee ...

So führen Sie das H5 -Projekt aus So führen Sie das H5 -Projekt aus Apr 06, 2025 pm 12:21 PM

Ausführen des H5 -Projekts erfordert die folgenden Schritte: Installation der erforderlichen Tools wie Webserver, Node.js, Entwicklungstools usw. Erstellen Sie eine Entwicklungsumgebung, erstellen Sie Projektordner, initialisieren Sie Projekte und schreiben Sie Code. Starten Sie den Entwicklungsserver und führen Sie den Befehl mit der Befehlszeile aus. Vorschau des Projekts in Ihrem Browser und geben Sie die Entwicklungsserver -URL ein. Veröffentlichen Sie Projekte, optimieren Sie Code, stellen Sie Projekte bereit und richten Sie die Webserverkonfiguration ein.

Wie gibt ich die mit dem Modell in Beego Orm zugeordnete Datenbank an? Wie gibt ich die mit dem Modell in Beego Orm zugeordnete Datenbank an? Apr 02, 2025 pm 03:54 PM

Wie kann man im Beegoorm -Framework die mit dem Modell zugeordnete Datenbank angeben? In vielen BeEGO -Projekten müssen mehrere Datenbanken gleichzeitig betrieben werden. Bei Verwendung von BeEGO ...

Wie löste ich das Problem des Typs des user_id -Typs bei der Verwendung von Redis -Stream, um Nachrichtenwarteschlangen in GO -Sprache zu implementieren? Wie löste ich das Problem des Typs des user_id -Typs bei der Verwendung von Redis -Stream, um Nachrichtenwarteschlangen in GO -Sprache zu implementieren? Apr 02, 2025 pm 04:54 PM

Das Problem der Verwendung von RETISTREAM zur Implementierung von Nachrichtenwarteschlangen in der GO -Sprache besteht darin, die Go -Sprache und Redis zu verwenden ...

Wie erhalten Sie die Daten der Versandregion der Überseeversion? Was stehen einige vorgefertigte Ressourcen zur Verfügung? Wie erhalten Sie die Daten der Versandregion der Überseeversion? Was stehen einige vorgefertigte Ressourcen zur Verfügung? Apr 01, 2025 am 08:15 AM

Frage Beschreibung: Wie erhalten Sie die Daten der Versandregion der Überseeversion? Gibt es bereitgestellte Ressourcen? Werden Sie im grenzüberschreitenden E-Commerce oder im globalisierten Geschäft genau ...

Bedarf die Produktion von H5 -Seiten eine kontinuierliche Wartung? Bedarf die Produktion von H5 -Seiten eine kontinuierliche Wartung? Apr 05, 2025 pm 11:27 PM

Die H5 -Seite muss aufgrund von Faktoren wie Code -Schwachstellen, Browserkompatibilität, Leistungsoptimierung, Sicherheitsaktualisierungen und Verbesserungen der Benutzererfahrung kontinuierlich aufrechterhalten werden. Zu den effektiven Wartungsmethoden gehören das Erstellen eines vollständigen Testsystems, die Verwendung von Versionstools für Versionskontrolle, die regelmäßige Überwachung der Seitenleistung, das Sammeln von Benutzern und die Formulierung von Wartungsplänen.

See all articles