Laut Nachrichten vom 23. Oktober hat Nvidia kürzlich ein KI-System namens Eureka angekündigt, das auf GPT-4 von OpenAI basiert und es Robotern ermöglicht, Aufgaben wie „Stifte drehen“, „Schubladen öffnen“ und „Scheren halten“ auszuführen mehr als 30 komplexe Aktionen wie „den Ball zwischen den Händen weitergeben“.
Nach einer Anfrage erfuhr diese Website, dass das NVIDIA Research Institute die Entwicklung von Eureka geleitet hat. Dieses KI-System ermöglicht es Entwicklern, Verstärkungslernen (Referenzlernen) mit NVIDIAs eigener Physiksimulationssoftware Isaac Gym durchzuführen.
Anima Anandkumar, leitende Direktorin der KI-Forschungsabteilung von NVIDIA, ist der Ansicht, dass das „Reinforcement Learning“ zwar in den letzten 10 Jahren Fortschritte gemacht hat, es aber immer noch viele Herausforderungen gibt, wie zum Beispiel das „Belohnungsdesign“ und andere Aspekte, die noch in der Schwebe sind „Versuch und Irrtum“-Phase. Der aktuell von NVIDIA angekündigte Eureka soll schwierige Aufgaben erfüllen und ist der erste Versuch, generative KI und Reinforcement-Learning-Algorithmen zu kombinieren.
Das von Eureka mithilfe von GPT-4 generierte „Belohnungsdesign“-Schema kann das „Versuch-und-Irrtum“-Lernen des Roboters unterstützen und die Aufgaben von 80 % der menschlichen Experten übernehmen, wodurch die durchschnittliche Trainingseffizienz des Roboters erhöht wird Um mehr als 50 % verbessert.
Es wird berichtet, dass Entwickler bei der Erstellung eines „Belohnungsdesign“-Plans keine zusätzlichen Aufgabenaufforderungen eingeben oder vordefinierte Belohnungsvorlagen schreiben müssen. In Kombination mit der manuellen Korrektur von Belohnungen entsprechen die Aktionen des Roboters letztendlich besser den Absichten des Entwicklers .
In Kombination mit Isaac Gym kann dieses KI-System die GPU-Beschleunigung nutzen, um Simulationen durchzuführen und die Qualität einer großen Anzahl von Kandidaten-Feedbacks schnell auszuwerten, wodurch die Trainingseffizienz verbessert und statistische Zusammenfassungen auf der Grundlage der Trainingsergebnisse erstellt werden, um die „Belohnung“ zu verbessern Plan". Während das KI-System das Reaktionsniveau von Robotern verbessert, ist es auf eine breitere Palette von Robotertypen anwendbar, wie z. B. „Tiertyp“ (vierbeinig), „Menschtyp (zweibeinig)“, „ Quadrocopter", Armroboter usw. Alle können mit dem Eureka-System ausgestattet werden.
▲ Bildquelle NVIDIA
▲ Bildquelle NVIDIA
NVIDIA hat auf Eureka den „Open Source Sensitivity Benchmark Test“ durchgeführt und nach der Auswertung der Trainingsergebnisse von 20 Aufgaben kamen wir zu einem zufriedenstellenden Ergebnis.
Dementsprechend glaubt NVIDIA, dass Eureka eine geschickte Robotersteuerung erreichen und Animatoren neue Möglichkeiten bieten kann, „realistische physische Bewegungen zu erzeugen“.
Das obige ist der detaillierte Inhalt vonNvidia bringt das KI-System Eureka auf den Markt, das es Robotern ermöglicht, komplexe Aufgaben wie Stiftdrehen und Passieren auszuführen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!