Heim Technologie-Peripheriegeräte KI Mit dem „Hund' auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Mit dem „Hund' auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

May 05, 2024 pm 01:01 PM
git 工程 dreureka

Der Roboterhund läuft gleichmäßig auf dem Yoga-Ball und sein Gleichgewicht ist ziemlich gut:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Er kann verschiedene Szenen bewältigen, egal ob es sich um einen flachen Gehweg oder einen anspruchsvollen Rasen handelt, er kann Folgendes halten:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Sogar Als Forscher einen Yogaball traten, kippte der Roboterhund nicht um:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Der Roboterhund konnte auch beim Entleeren von Ballons das Gleichgewicht halten:

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Die obigen Demonstrationen erfolgen alle mit einfacher Geschwindigkeit, ohne Beschleunigungsverarbeitung.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
  • Papieradresse: https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf
  • Projekthomepage: https://github.com/eureka- Forschung/DrEureka
  • Titel des Papiers: DrEureka: Language Model Guided Sim-To-Real Transfer

Diese Forschung wurde gemeinsam von Forschern der University of Pennsylvania, NVIDIA und der University of Texas in Austin erstellt und ist vollständig Open Source. Sie schlugen DrEureka (Domain Randomized Eureka) vor, einen neuen Algorithmus, der LLM nutzt, um Belohnungsdesign und domänenrandomisierte Parameterkonfiguration zu implementieren, wodurch gleichzeitig eine Übertragung von Simulation auf Realität erreicht werden kann. Die Studie demonstriert die Fähigkeit des DrEureka-Algorithmus, neuartige Roboteraufgaben zu lösen, beispielsweise das Balancieren eines vierbeinigen Roboters und das Gehen auf einem Yogaball, ohne dass ein iteratives manuelles Design erforderlich ist.

DrEureka basiert auf Eureka, das auch zu einem der zehn besten NVIDIA-Projekte im Jahr 2023 gekürt wurde. Weitere Informationen zu Eureka finden Sie unter „Mit GPT-4 hat der Roboter gelernt, wie man Stifte dreht und Walnüsse plattiert“.

Im Zusammenfassungsteil der Arbeit erklärten die Forscher, dass die Übertragung von in Simulationen erlernten Strategien auf die reale Welt eine vielversprechende Strategie für den groß angelegten Erwerb von Roboterfähigkeiten sei. Simulation-zu-Realität-Ansätze basieren jedoch häufig auf der manuellen Gestaltung und Abstimmung von Aufgabenbelohnungsfunktionen und physikalischen Simulationsparametern, was den Prozess langsam und arbeitsintensiv macht. In diesem Artikel wird die Verwendung großer Sprachmodelle (LLMs) untersucht, um die Simulation zu einem realistischen Design zu automatisieren und zu beschleunigen.

Jim Fan, einer der Autoren des Papiers und leitender Wissenschaftler bei NVIDIA, war ebenfalls an dieser Forschung beteiligt. Zuvor gründete Nvidia unter der Leitung von Jim Fan ein KI-Labor, das sich auf verkörperte Intelligenz spezialisierte. Jim Fan sagte:

„Wir haben einem Roboterhund beigebracht, auf einem Yoga-Ball zu balancieren und zu laufen. Dies wurde vollständig in der Simulation durchgeführt und dann ohne Proben und ohne Feinabstimmung in die reale Welt übertragen und direkt ausgeführt.“

Das Gehen mit dem Yogaball ist für den Roboterhund besonders schwierig, da wir die Oberfläche des Hüpfballs nicht genau simulieren können. DrEureka kann jedoch problemlos eine große Anzahl simulierter realer Konfigurationen durchsuchen und dem Roboterhund ermöglichen um den Ball auf verschiedenen Terrains zu kontrollieren oder sogar seitwärts zu gehen!

Im Allgemeinen wird die Migration von der Simulation zur Realität durch Domänen-Randomisierung erreicht, was ein langwieriger Prozess ist, bei dem Robotikexperten jeden Parameter im Auge behalten und manuell anpassen müssen 4 Solche hochmodernen LLMs verfügen über eine Menge eingebauter physikalischer Intuition, einschließlich Reibung, Dämpfung, Steifigkeit, Schwerkraft usw. Mit GPT-4 kann DrEureka diese Parameter geschickt anpassen und seine Argumentation gut erklären 》

Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft

Einführung in das Papier

DrEureka-Prozess ist wie folgt: Er akzeptiert Aufgaben- und Sicherheitsanweisungen und Umgebungsquellcode und führt Eureka aus, um regulierte Belohnungsfunktionen und -richtlinien zu generieren. Anschließend wird die Strategie unter verschiedenen Simulationsbedingungen getestet, um einen belohnungsbewussten physischen Prior zu erstellen, der einem LLM zugeführt wird, um einen Satz von Domänen-Randomisierungsparametern (DR) zu generieren. Abschließend wird die Richtlinie mithilfe der synthetisierten Belohnungs- und DR-Parameter für die tatsächliche Bereitstellung trainiert.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Eureka-Belohnungsdesign. Die Belohnungsdesignkomponente basiert aufgrund ihrer Einfachheit und Ausdruckskraft auf Eureka. In diesem Dokument werden jedoch einige Verbesserungen vorgestellt, um ihre Anwendbarkeit von der Simulation auf reale Umgebungen zu verbessern. Der Pseudocode lautet wie folgt:
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Belohnungsbewusste Physik vor (RAPP, belohnungsbewusste Physik vor). Sicherheitsbelohnungsfunktionen können das politische Verhalten regulieren, um Umweltentscheidungen festzulegen, reichen jedoch allein nicht aus, um einen Transfer von der Simulation in die Realität zu erreichen. Daher stellt dieses Papier einen einfachen RAPP-Mechanismus vor, um den grundlegenden Umfang von LLM einzuschränken.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
LLM wird für die Domain-Randomisierung verwendet. Angesichts des RAPP-Bereichs für jeden DR-Parameter weist der letzte Schritt von DrEureka LLM an, Domänen-Randomisierungskonfigurationen innerhalb der Grenzen des RAPP-Bereichs zu generieren. Siehe Abbildung 3 für den spezifischen Prozess:
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Diese Forschung verwendet Unitree Go1 für Experimente. Go1 ist ein kleiner vierbeiniger Roboter mit 12 Freiheitsgraden in seinen vier Beinen. In der vierbeinigen Fortbewegungsaufgabe bewertet dieser Artikel auch systematisch die Leistung von DrEureka-Richtlinien auf mehreren realen Terrains und stellt fest, dass sie robust bleiben und Richtlinien übertreffen, die mithilfe von Menschen entworfener Belohnungs- und DR-Konfigurationen trainiert wurden.
Mit dem „Hund auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft
Weitere Informationen finden Sie im Originalpapier.

Das obige ist der detaillierte Inhalt vonMit dem „Hund' auf dem Yogaball spazieren gehen! Eureka, eines der zehn besten Projekte von NVIDIA, hat einen neuen Durchbruch geschafft. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

So installieren Sie Deepseek So installieren Sie Deepseek Feb 19, 2025 pm 05:48 PM

Es gibt viele Möglichkeiten, Deepseek zu installieren, einschließlich: kompilieren Sie von Quelle (für erfahrene Entwickler) mit vorberechtigten Paketen (für Windows -Benutzer) mit Docker -Containern (für bequem am besten, um die Kompatibilität nicht zu sorgen), unabhängig von der Methode, die Sie auswählen, bitte lesen Die offiziellen Dokumente vorbereiten sie sorgfältig und bereiten sie voll und ganz vor, um unnötige Schwierigkeiten zu vermeiden.

Zusammenfassung der FAQs für die Verwendung von Deepseek Zusammenfassung der FAQs für die Verwendung von Deepseek Feb 19, 2025 pm 03:45 PM

Deepseekai Tool User Guide und FAQ Deepseek ist ein leistungsstarkes KI -Intelligent -Tool. FAQ: Der Unterschied zwischen verschiedenen Zugriffsmethoden: Es gibt keinen Unterschied in der Funktion zwischen Webversion, App -Version und API -Aufrufen, und App ist nur ein Wrapper für die Webversion. Die lokale Bereitstellung verwendet ein Destillationsmodell, das der Vollversion von Deepseek-R1 geringfügig unteren ist, das 32-Bit-Modell theoretisch 90% Vollversionsfunktion. Was ist eine Taverne? SillyTervern ist eine Front-End-Oberfläche, die das KI-Modell über API oder Ollama anruft. Was ist Breaking Limit

Was sind die KI-Tools? Was sind die KI-Tools? Nov 29, 2024 am 11:11 AM

Zu den KI-Tools gehören: Doubao, ChatGPT, Gemini, BlenderBot usw.

Was sind die Graustufenverschlüsselungsfonds? Was sind die Graustufenverschlüsselungsfonds? Mar 05, 2025 pm 12:33 PM

Grayscale -Investitionen: Der Kanal für institutionelle Anleger, um den Kryptowährungsmarkt zu betreten. Das Unternehmen hat mehrere Krypto -Trusts auf den Markt gebracht, was die weit verbreitete Marktaufmerksamkeit auf sich gezogen hat, die Auswirkungen dieser Mittel auf die Tokenpreise jedoch erheblich variieren. In diesem Artikel werden einige der wichtigsten Krypto -Vertrauensfonds von Grayscale ausführlich vorgestellt. Grayscale Major Crypto Trust Funds, die auf einer Blick Grayscale-Investition erhältlich sind (gegründet von DigitalCurrencyGroup im Jahr 2013), verwaltet eine Vielzahl von Crypto Asset Trust Funds und bietet institutionelle Anleger und Einzelpersonen mit hohem Nettel mit konformen Investitionskanälen. Zu den Hauptfonds gehören: Zcash (ZEC), Sol,

Welche Auswirkungen auf die Branche haben die Top -Markthersteller in den Kryptomarkt? Welche Auswirkungen auf die Branche haben die Top -Markthersteller in den Kryptomarkt? Mar 04, 2025 pm 08:03 PM

Der Einstieg des Makers von Top -Market Maker Castle in den Bitcoin Market Maker ist ein Symbol für die Reife des Bitcoin -Marktes und ein wichtiger Schritt für traditionelle Finanzkräfte, um um zukünftige Vermögenswerte zu konkurrieren. Nach Angaben von Bloomberg versucht Citadel Securities am 25. Februar, ein Liquiditätsanbieter für Kryptowährungen zu werden. Das Unternehmen zielt darauf ab, sich der Liste der Markthersteller an verschiedenen Börsen anzuschließen, einschließlich Börsen, die von CoinbaseGlobal, BinanceHoldings und Crypto.com betrieben werden, sagten mit der Angelegenheit, die mit der Angelegenheit vertraut sind. Nach der Genehmigung von der Börse plante das Unternehmen zunächst, ein Markthersteller -Team außerhalb der USA einzurichten. Dieser Schritt ist nicht nur ein Zeichen

Delphi Digital: Wie kann man die neue KI -Wirtschaft verändern, indem sie die neue Elizaos V2 -Architektur analysiert? Delphi Digital: Wie kann man die neue KI -Wirtschaft verändern, indem sie die neue Elizaos V2 -Architektur analysiert? Mar 04, 2025 pm 07:00 PM

ElizaOSV2: Erleichterung der KI und Führung der neuen Wirtschaft von Web3. Dieser Artikel wird sich mit den wichtigsten Innovationen von Elizaosv2 befassen und wie er eine KI-gesteuerte zukünftige Wirtschaft prägt. KI -Automatisierung: Es war ursprünglich ein KI -Framework, der sich auf Web3 -Automatisierung konzentrierte. Mit der V1 -Version kann AI mit intelligenten Verträgen und Blockchain -Daten interagieren, während die V2 -Version erhebliche Leistungsverbesserungen erzielt. Anstatt nur einfache Anweisungen auszuführen, kann KI Workflows unabhängig verwalten, Geschäft betreiben und finanzielle Strategien entwickeln. Architektur -Upgrade: Verbessert a

Das Geheimnis hinter O1/Deepseek-R1 kann auch in multimodalen großen Modellen verwendet werden Das Geheimnis hinter O1/Deepseek-R1 kann auch in multimodalen großen Modellen verwendet werden Mar 12, 2025 pm 01:03 PM

Forscher der Shanghai Jiaotong University, Shanghai Ailab und der chinesischen Universität von Hongkong haben das Open-Source-Projekt zur Visual-RFT (visuelle Verbesserung der Feinabstimmung) gestartet, für das nur eine geringe Datenmenge erforderlich ist, um die Leistung des visuellen Sprachen-Big-Modells (LVLM) signifikant zu verbessern. Visual-RFT kombiniert geschickt die regelbasierte Verstärkungslernansatz von Deepseek-R1 mit dem RFT-Paradigma (Verstärkung der Verstärkung der Verstärkung) und erweitert diesen Ansatz erfolgreich vom Textfeld auf das Gesichtsfeld. Durch die Gestaltung der entsprechenden Regelprämien für Aufgaben wie die visuelle Unterkategorisierung und Objekterkennung überwindet die visuelle RFT die Einschränkungen der Deepseek-R1-Methode, die auf Text, mathematisches Denken und andere Bereiche beschränkt ist und eine neue Möglichkeit für das LVLM-Training bietet. Vis

Bitweise: Unternehmen kaufen Bitcoin einen vernachlässigten großen Trend Bitweise: Unternehmen kaufen Bitcoin einen vernachlässigten großen Trend Mar 05, 2025 pm 02:42 PM

Wöchentliche Beobachtung: Unternehmen, die Bitcoin horten - ein Brauenwechsel Ich weise oft auf einige übersehene Markttrends in wöchentlichen Memos. Der Schritt von MicroStrategy ist ein starkes Beispiel. Viele Menschen mögen sagen: "Microstrategy und Michaelsaylor sind bereits bekannt, worauf werden Sie achten?" Diese Ansicht ist einseitig. Eingehende Untersuchungen zur Einführung von Bitcoin als Reserve-Vermögenswert in den letzten Monaten zeigen, dass dies kein isolierter Fall ist, sondern ein wichtiger Trend, der sich herausstellt. Ich gehe davon aus, dass in den nächsten 12 bis 18 Monaten Hunderte von Unternehmen dem Beispiel folgen und große Mengen Bitcoin kaufen werden

See all articles