Inhaltsverzeichnis
Schauen wir uns zunächst die erste an:
SARA-RT
Nicht genügend Daten? Erstellen Sie es selbst
Apropos Google-Robotern suchen, wir müssen
Heim Technologie-Peripheriegeräte KI Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.

Jan 11, 2024 pm 10:36 PM
ai 训练

Fast zeitgleich mit Stanfords „Shrimp Fried and Dishwashing“-Roboter veröffentlichte Google DeepMind auch seine neuesten Ergebnisse der verkörperten Intelligenz.

... - schnell Gleichzeitig hat die Qualität nicht abgenommen und die Genauigkeit ist um 10,6 % gestiegen.

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.

Dann gibt es ein neues Framework

spezialisiert auf Generalisierungsfähigkeiten

, das Bewegungsbahnaufforderungen für den Roboter erstellen kann, sodass dieser 41 noch nie dagewesene Aufgaben bewältigen und eine Erfolgsquote von 63 % erreichen kann.

Unterschätzen Sie diese Vielfalt nicht, Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.

Im Vergleich zu den vorherigen 29 % ist die Verbesserung ziemlich groß

. Das letzte ist ein

Roboterdatenerfassungssystem

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten., das 20 Roboter gleichzeitig verwalten kann. Bisher wurden 77.000 experimentelle Daten aus ihren Aktivitäten gesammelt. Sie werden Google dabei helfen, die nachfolgende Trainingsarbeit besser abzuschließen.

Was sind also diese drei Ergebnisse konkret? Schauen wir sie uns einzeln an.

Der erste Schritt in der täglichen Anwendung von Robotern: Sie können Aufgaben, die Sie noch nie zuvor gesehen haben, direkt ausführen.

Google wies darauf hin, dass zwei grundlegende Herausforderungen gelöst werden müssen, um einen Roboter zu realisieren, der wirklich in die reale Welt eindringen kann. 1. Neue Fähigkeit zur Aufgabenförderung

2. Verbesserung der Entscheidungsgeschwindigkeit

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.Die ersten beiden Ergebnisse dieser dreiteiligen Serie sind hauptsächlich Verbesserungen in diesen beiden Bereichen und basieren beide auf Googles grundlegendem Robotermodell Robotics Transformer

( Abgekürzt als RT)

.

Schauen wir uns zunächst die erste an:

RT-Trajectory

, die Robotern bei der Verallgemeinerung hilft.

Für Menschen sind Aufgaben wie das Reinigen des Tisches leicht zu verstehen, aber Roboter verstehen es nicht sehr gut.

Aber glücklicherweise können wir ihm diese Anweisung auf vielfältige Weise vermitteln, sodass er tatsächlich körperliche Maßnahmen ergreifen kann. Im Allgemeinen besteht die traditionelle Methode darin, die Aufgabe einer bestimmten Aktion zuzuordnen und sie dann vom Roboterarm ausführen zu lassen. Beispielsweise kann das Abwischen des Tisches in „Klammer schließen, nach links bewegen, nach rechts bewegen“ zerlegt werden.

Offensichtlich ist die Generalisierungsfähigkeit dieser Methode sehr schlecht. Hier bringt Googles neu vorgeschlagene RT-Trajectory dem Roboter bei, Aufgaben zu erledigen, indem sie ihn mit visuellen Hinweisen versorgt.

Konkret werden von RT-Trajectory gesteuerte Roboter während des Trainings 2D-Trajektorien-verbesserte Daten hinzufügen.

Diese Flugbahnen werden als RGB-Bilder dargestellt, einschließlich Routen und Schlüsselpunkten, und liefern einfache, aber sehr nützliche Hinweise, während der Roboter lernt, Aufgaben auszuführen.

Mit diesem Modell wurde die Erfolgsquote von Robotern, die noch nie dagewesene Aufgaben ausführen, direkt um das 1-fache erhöht

(im Vergleich zu Googles Basisrobotermodell RT-2, von 29 % => 63 %)

.

Was noch erwähnenswert ist, ist, dass RT-Trajectory Flugbahnen auf verschiedene Arten erstellen kann, unter anderem:

durch das Ansehen menschlicher Demonstrationen, das Akzeptieren handgezeichneter Skizzen und die Generierung durch VLMDer DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten. (Visual Language Model)

.

Der zweite Schritt der täglichen Robotisierung: Die Entscheidungsgeschwindigkeit muss schnell seinNachdem die Generalisierungsfähigkeit verbessert wurde, konzentrieren wir uns auf die Entscheidungsgeschwindigkeit.

Das RT-Modell von Google verwendet die Transformer-Architektur. Obwohl der Transformer leistungsstark ist, ist er stark auf das Aufmerksamkeitsmodul mit quadratischer Komplexität angewiesen.
Sobald also die Eingaben in das RT-Modell verdoppelt werden (z. B. die Ausstattung des Roboters mit einem Sensor mit höherer Auflösung)

, erhöhen sich die für die Verarbeitung erforderlichen Rechenressourcen auf das Vierfache, was die Entscheidung erheblich verlangsamt -Geschwindigkeit machen.

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.Um die Geschwindigkeit von Robotern zu verbessern, hat Google

SARA-RT

auf dem Basismodell Robotics Transformer entwickelt.

SARA-RT verwendet eine neue Methode zur Modellfeinabstimmung, um das ursprüngliche RT-Modell effizienter zu machen.

Diese Methode wird von Google als „Up-Training“ bezeichnet. Ihre Hauptfunktion besteht darin, die ursprüngliche quadratische Komplexität in lineare Komplexität umzuwandeln und dabei die Verarbeitungsqualität beizubehalten.

Wenn SARA-RT auf das RT-2-Modell mit Milliarden von Parametern angewendet wird, kann letzteres bei einer Vielzahl von Aufgaben schnellere Betriebsgeschwindigkeiten und höhere Genauigkeit erreichen.

Erwähnenswert ist auch, dass SARA-RT eine universelle Methode zur Beschleunigung von Transformer ohne teures Vortraining bietet, sodass es gut gefördert werden kann.

Nicht genügend Daten? Erstellen Sie es selbst

Um Robotern dabei zu helfen, die von Menschen zugewiesenen Aufgaben besser zu verstehen, begann Google auch mit Daten und baute direkt ein Erfassungssystem auf: AutoRT.

Dieses System kombiniert große Modelle (einschließlich LLM und VLM) mit Robotersteuerungsmodellen (RT) , um den Roboter kontinuierlich anzuweisen, verschiedene Aufgaben in der realen Welt auszuführen und so Daten zu generieren und zu sammeln.

Der spezifische Prozess ist wie folgt:

Lassen Sie den Roboter „frei“ mit der Umgebung in Kontakt treten und sich dem Ziel nähern.

Dann verwenden Sie die Kamera und das VLM-Modell, um die Szene vor Ihnen zu beschreiben, einschließlich der spezifischen Elemente.

Dann verwendet LLM diese Informationen, um verschiedene Aufgaben zu generieren.

Bitte beachten Sie, dass der Roboter nach der Generierung nicht sofort ausgeführt wird. Stattdessen wird LLM verwendet, um zu filternwelche Aufgaben unabhängig erledigt werden können, welche eine menschliche Fernsteuerung erfordern und welche nicht erledigt werden können alle.

Was nicht möglich ist, ist „die Tüte mit Kartoffelchips zu öffnen“, da dafür zwei Roboterarme (standardmäßig nur 1) erforderlich sind.

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.

Nach Abschluss dieser Screening-Aufgabe kann der Roboter sie dann tatsächlich ausführen.

Schließlich schließt das AutoRT-System die Datenerfassung ab und führt eine Diversitätsbewertung durch.

Berichten zufolge kann AutoRT bis zu 20 Roboter gleichzeitig koordinieren. In 7 Monaten wurden insgesamt 77.000 Testdaten, darunter 6.650 einzigartige Aufgaben, gesammelt.

Schließlich legt Google bei diesem System auch Wert auf Sicherheit.

Schließlich gelten die Erfassungsaufgaben von AutoRT für die reale Welt und „Sicherheitsleitplanken“ sind unverzichtbar.

Konkret ist der vom LLM bereitgestellte Basic Safety Code, der Roboter auf Aufgaben überprüft, teilweise von Isaac Asimovs Drei Gesetzen der Robotik inspiriert – in erster Linie „Ein Roboter darf einem Menschen keinen Schaden zufügen.“

Die zweite Anforderung lautet dass der Roboter keine Aufgaben ausführen darf, an denen Menschen, Tiere, scharfe Gegenstände oder Elektrogeräte beteiligt sind

Aber das reicht nicht aus

Daher ist AutoRT auch in der regulären Robotik mit mehreren Ebenen praktischer Sicherheitsmaßnahmen ausgestattet. Beispielsweise stoppt der Roboter automatisch, wenn die Kraft auf seine Gelenke überschreitet einen bestimmten Schwellenwert, alle Aktionen können durch physische Schalter gestoppt werden, die im menschlichen Sichtfeld bleiben, und mehr

Der DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten. Möchten Sie mehr über diese neuesten Ergebnisse von Google erfahren

Gute Neuigkeiten, außer für RT-Trajectory, das nur Artikel veröffentlicht, wird der Rest zusammen mit dem Code und den Artikeln veröffentlicht. Sie können gerne nach weiteren ~

One More Thing

Apropos Google-Robotern suchen, wir müssen

RT-2

erwähnen (Alle Ergebnisse dieses Artikels basieren auch darauf) Die Erstellung dieses Modells dauerte 7 Monate und wurde Ende Juli dieses Jahres veröffentlicht.

Es bettet das visuelle Text-Multimodal ein Modell VLM kann nicht nur „menschliche Wörter“ verstehen, sondern auch über „menschliche Wörter“ nachdenken und einige Aufgaben ausführen, die nicht in einem Schritt erledigt werden können, wie zum Beispiel das genaue Aufsammeln „ausgestorbener Tiere“ aus drei Plastikspielzeugen: Löwen, Wale und Dinosaurier. ", sehr erstaunlich.

Jetzt, in etwas mehr als 5 Monaten, hat es schnelle Verbesserungen in der Verallgemeinerungsfähigkeit und der Entscheidungsgeschwindigkeit erlebt. Wir können nicht anders, als zu seufzen: Ich kann es mir nicht vorstellen dass ein Roboter wirklich in die Welt stürmt. Wie schnell wird er für Tausende von Haushalten sein?

Das obige ist der detaillierte Inhalt vonDer DeepMind-Roboter von Google hat drei Ergebnisse in Folge veröffentlicht! Beide Funktionen wurden vollständig verbessert und das Datenerfassungssystem kann 20 Roboter gleichzeitig verwalten.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Welche Methode wird verwendet, um Strings in Objekte in Vue.js umzuwandeln? Welche Methode wird verwendet, um Strings in Objekte in Vue.js umzuwandeln? Apr 07, 2025 pm 09:39 PM

Bei der Konvertierung von Zeichenfolgen in Objekte in Vue.js wird JSON.Parse () für Standard -JSON -Zeichenfolgen bevorzugt. Bei nicht standardmäßigen JSON-Zeichenfolgen kann die Zeichenfolge durch Verwendung regelmäßiger Ausdrücke verarbeitet und Methoden gemäß dem Format oder dekodierten URL-kodiert reduziert werden. Wählen Sie die entsprechende Methode gemäß dem String -Format aus und achten Sie auf Sicherheits- und Codierungsprobleme, um Fehler zu vermeiden.

Vue- und Element-UI-Kaskaden-Dropdown-Box V-Model-Bindung Vue- und Element-UI-Kaskaden-Dropdown-Box V-Model-Bindung Apr 07, 2025 pm 08:06 PM

Vue- und Element-UI-kaskadierte Dropdown-Boxen V-Model-Bindung gemeinsame Grubenpunkte: V-Model bindet ein Array, das die ausgewählten Werte auf jeder Ebene des kaskadierten Auswahlfelds darstellt, nicht auf einer Zeichenfolge; Der Anfangswert von ausgewählten Optionen muss ein leeres Array sein, nicht null oder undefiniert. Die dynamische Belastung von Daten erfordert die Verwendung asynchroner Programmierkenntnisse, um Datenaktualisierungen asynchron zu verarbeiten. Für riesige Datensätze sollten Leistungsoptimierungstechniken wie virtuelles Scrollen und fauler Laden in Betracht gezogen werden.

VUE.JS Wie kann man ein Array von String -Typ in ein Array von Objekten umwandeln? VUE.JS Wie kann man ein Array von String -Typ in ein Array von Objekten umwandeln? Apr 07, 2025 pm 09:36 PM

Zusammenfassung: Es gibt die folgenden Methoden zum Umwandeln von VUE.JS -String -Arrays in Objektarrays: Grundlegende Methode: Verwenden Sie die Kartenfunktion, um regelmäßige formatierte Daten zu entsprechen. Erweitertes Gameplay: Die Verwendung regulärer Ausdrücke kann komplexe Formate ausführen, müssen jedoch sorgfältig geschrieben und berücksichtigt werden. Leistungsoptimierung: In Betracht ziehen die große Datenmenge, asynchrone Operationen oder effiziente Datenverarbeitungsbibliotheken können verwendet werden. Best Practice: Clear Code -Stil, verwenden Sie sinnvolle variable Namen und Kommentare, um den Code präzise zu halten.

So stellen Sie die Zeitüberschreitung von Vue Axios fest So stellen Sie die Zeitüberschreitung von Vue Axios fest Apr 07, 2025 pm 10:03 PM

Um die Zeitüberschreitung für Vue Axios festzulegen, können wir eine Axios -Instanz erstellen und die Zeitleitungsoption angeben: in globalen Einstellungen: vue.Prototyp. $ Axios = axios.create ({Timeout: 5000}); In einer einzigen Anfrage: this. $ axios.get ('/api/user', {timeout: 10000}).

Laravels Geospatial: Optimierung interaktiver Karten und großen Datenmengen Laravels Geospatial: Optimierung interaktiver Karten und großen Datenmengen Apr 08, 2025 pm 12:24 PM

Verarbeiten Sie 7 Millionen Aufzeichnungen effizient und erstellen Sie interaktive Karten mit Geospatial -Technologie. In diesem Artikel wird untersucht, wie über 7 Millionen Datensätze mithilfe von Laravel und MySQL effizient verarbeitet und in interaktive Kartenvisualisierungen umgewandelt werden können. Erstes Herausforderungsprojektanforderungen: Mit 7 Millionen Datensätzen in der MySQL -Datenbank wertvolle Erkenntnisse extrahieren. Viele Menschen erwägen zunächst Programmiersprachen, aber ignorieren die Datenbank selbst: Kann sie den Anforderungen erfüllen? Ist Datenmigration oder strukturelle Anpassung erforderlich? Kann MySQL einer so großen Datenbelastung standhalten? Voranalyse: Schlüsselfilter und Eigenschaften müssen identifiziert werden. Nach der Analyse wurde festgestellt, dass nur wenige Attribute mit der Lösung zusammenhängen. Wir haben die Machbarkeit des Filters überprüft und einige Einschränkungen festgelegt, um die Suche zu optimieren. Kartensuche basierend auf der Stadt

Remote Senior Backend Engineers (Plattformen) benötigen Kreise Remote Senior Backend Engineers (Plattformen) benötigen Kreise Apr 08, 2025 pm 12:27 PM

Remote Senior Backend Engineer Job Vacant Company: Circle Standort: Remote-Büro-Jobtyp: Vollzeitgehalt: 130.000 bis 140.000 US-Dollar Stellenbeschreibung Nehmen Sie an der Forschung und Entwicklung von Mobilfunkanwendungen und öffentlichen API-bezogenen Funktionen, die den gesamten Lebenszyklus der Softwareentwicklung abdecken. Die Hauptaufgaben erledigen die Entwicklungsarbeit unabhängig von RubyonRails und arbeiten mit dem Front-End-Team von React/Redux/Relay zusammen. Erstellen Sie die Kernfunktionalität und -verbesserungen für Webanwendungen und arbeiten Sie eng mit Designer und Führung während des gesamten funktionalen Designprozesses zusammen. Fördern Sie positive Entwicklungsprozesse und priorisieren Sie die Iterationsgeschwindigkeit. Erfordert mehr als 6 Jahre komplexes Backend für Webanwendungen

Wie man MySQL löst, kann nicht gestartet werden Wie man MySQL löst, kann nicht gestartet werden Apr 08, 2025 pm 02:21 PM

Es gibt viele Gründe, warum MySQL Startup fehlschlägt und durch Überprüfung des Fehlerprotokolls diagnostiziert werden kann. Zu den allgemeinen Ursachen gehören Portkonflikte (prüfen Portbelegung und Änderung der Konfiguration), Berechtigungsprobleme (Überprüfen Sie den Dienst Ausführen von Benutzerberechtigungen), Konfigurationsdateifehler (Überprüfung der Parametereinstellungen), Datenverzeichniskorruption (Wiederherstellung von Daten oder Wiederaufbautabellenraum), InnoDB-Tabellenraumprobleme (prüfen IBDATA1-Dateien), Plug-in-Ladeversagen (Überprüfen Sie Fehlerprotokolle). Wenn Sie Probleme lösen, sollten Sie sie anhand des Fehlerprotokolls analysieren, die Hauptursache des Problems finden und die Gewohnheit entwickeln, Daten regelmäßig zu unterstützen, um Probleme zu verhindern und zu lösen.

So verwenden Sie MySQL nach der Installation So verwenden Sie MySQL nach der Installation Apr 08, 2025 am 11:48 AM

Der Artikel führt den Betrieb der MySQL -Datenbank vor. Zunächst müssen Sie einen MySQL -Client wie MySQLworkBench oder Befehlszeilen -Client installieren. 1. Verwenden Sie den Befehl mySQL-uroot-P, um eine Verbindung zum Server herzustellen und sich mit dem Stammkonto-Passwort anzumelden. 2. Verwenden Sie die Erstellung von Createdatabase, um eine Datenbank zu erstellen, und verwenden Sie eine Datenbank aus. 3.. Verwenden Sie CreateTable, um eine Tabelle zu erstellen, Felder und Datentypen zu definieren. 4. Verwenden Sie InsertInto, um Daten einzulegen, Daten abzufragen, Daten nach Aktualisierung zu aktualisieren und Daten nach Löschen zu löschen. Nur indem Sie diese Schritte beherrschen, lernen, mit gemeinsamen Problemen umzugehen und die Datenbankleistung zu optimieren, können Sie MySQL effizient verwenden.

See all articles