Laut Nachrichten vom 26. Juni sagte DeepMind, eine Tochtergesellschaft von Google, dass das Unternehmen ein künstliches Intelligenzmodell namens RoboCat entwickelt habe, das verschiedene Roboterarme steuern kann, um eine Reihe von Aufgaben auszuführen. Dies allein ist nicht besonders neu, aber DeepMind behauptet, dass das Modell das erste ist, das in der Lage ist, eine Vielzahl von Aufgaben zu lösen und sich an diese anzupassen, und zwar unter Verwendung verschiedener, realer Roboter.
RoboCat ist von Gato inspiriert, einem weiteren KI-Modell von DeepMind, das Texte, Bilder und Ereignisse analysieren und verarbeiten kann. Zu den Trainingsdaten von RoboCat gehören Bilder und Bewegungsdaten von simulierten und realen Robotern, die von anderen Robotersteuerungsmodellen in virtuellen Umgebungen, von Menschen gesteuerten Robotern und früheren Versionen von RoboCat selbst abgeleitet wurden.
Alex Lee, Forschungswissenschaftler bei DeepMind und einer der Mitarbeiter im RoboCat-Team, sagte in einem E-Mail-Interview mit TechCrunch: „Wir haben gezeigt, dass ein einzelnes großes Modell an mehreren realen Robotereinheiten gelöst werden kann. Vielfältige Aufgaben und können schnell.“ „
IT House stellte fest, dass DeepMind-Forscher zunächst von Menschen gesteuerte Roboterarme verwendeten, um alle Daten in einer simulierten oder realen Umgebung zu sammeln. Lassen Sie zum Beispiel einen Roboterarm Zahnräder aufnehmen oder Bausteine stapeln. Anschließend optimierten sie RoboCat, indem sie für jede Aufgabe ein spezielles „abgeleitetes“ Modell erstellten und es durchschnittlich 10.000 Mal üben ließen. Durch die Nutzung von Daten, die durch abgeleitete Modelle und Demonstrationsdaten generiert wurden, erweitern Forscher den Trainingsdatensatz von RoboCat weiter und trainieren neue Versionen von RoboCat.
Die endgültige Version von RoboCat wurde an insgesamt 253 Aufgaben trainiert und an 141 Variationen dieser Aufgaben getestet, sowohl in der Simulation als auch in der realen Welt. DeepMind behauptet, dass RoboCat gelernt hat, verschiedene Arten von Roboterarmen zu bedienen, nachdem es über mehrere Stunden hinweg 1.000 von Menschen kontrollierte Demonstrationen beobachtet hatte. Während RoboCat an vier Robotern mit Zwei-Finger-Armen trainiert wurde, konnte sich das Modell an einen komplexeren Arm mit Drei-Finger-Greifer und doppelt so vielen steuerbaren Eingaben anpassen.
Trotzdem schwankten die Erfolgsquoten von RoboCat bei verschiedenen Aufgaben in den DeepMind-Tests stark und reichten von einem Tiefstwert von 13 % bis zu einem Höchstwert von 99 %. Dies gilt bei 1000 Demonstrationen in den Trainingsdaten; wenn die Anzahl der Demonstrationen halbiert wird, sinkt die Erfolgsquote entsprechend. In einigen Fällen behauptet DeepMind jedoch, dass RoboCat neue Aufgaben durch die Beobachtung von nur 100 Demonstrationen erlernen kann.
Alex Lee glaubt, dass RoboCat das Lösen neuer Aufgaben weniger schwierig machen könnte. „Angesichts einer bestimmten Anzahl von Demonstrationen einer neuen Aufgabe kann RoboCat eine Feinabstimmung auf neue Aufgaben vornehmen und selbst mehr Daten generieren, um sich weiter zu verbessern“, fügte er hinzu.
In Zukunft möchte das Forschungsteam die Anzahl der Demonstrationen, die erforderlich sind, um RoboCat beizubringen, neue Aufgaben zu erledigen, auf weniger als 10 reduzieren.
Das obige ist der detaillierte Inhalt vonGoogles DeepMind hat das RoboCat-KI-Modell entwickelt, das eine Vielzahl von Robotern steuern kann, um eine Reihe von Aufgaben auszuführen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!