Heim > Technologie-Peripheriegeräte > KI > Figure ' S -Helix: KI, die menschliche Roboter in Ihr Zuhause bringt - Analytics Vidhya

Figure ' S -Helix: KI, die menschliche Roboter in Ihr Zuhause bringt - Analytics Vidhya

Lisa Kudrow
Freigeben: 2025-03-04 09:09:10
Original
767 Leute haben es durchsucht

Abbildung AI enthüllt Helix: Ein revolutionärer humanoider Roboter, der von einem VLA-Framework (Vision-Language-Action) angetrieben wird. Dieser innovative Ansatz ermöglicht die Helix, mit beispiellosen menschlichähnlichen Fähigkeiten zu argumentieren und zu arbeiten, wodurch die Lücke zwischen kontrollierten industriellen Robotik und der unvorhersehbaren Dynamik der Heimumgebungen geschlossen wird. In dieser detaillierten Übersicht werden die Funktionen von Helix basierend auf der kürzlich veröffentlichten Dokumentation und Demos untersucht.

Inhaltsverzeichnis:

  • Helix verstehen
  • Architektures Design: System 1 & System 2
    • System 2: Das "Big Brain"
    • System 1: Präzise Aktion Ausführung
  • Schlüssel technologische Fortschritte
  • Demonstrationsvideos
  • kollaborative Lebensmittelhandhabung
  • Vollkörpermotorregelung
  • Sprachgeführte Objektmanipulation
  • Zusammenfassung

Helix verstehen:

Helix verfügt über 35 Grad der Freiheit (DOF) und bietet eine beispiellose Geschicklichkeit und Autonomie für einen humanoiden Roboter. Im Gegensatz zu herkömmlichen Robotern, die eine umfangreiche manuelle Programmierung erfordern, führt Helix dynamisch komplexe, langfristige Aufgaben mit einfachen Anweisungen für natürliche Sprache aus. Dieser Durchbruch fördert die Praktikabilität von Robotern in heimischen Umgebungen erheblich, wo die Anpassungsfähigkeit an verschiedene Objekte und unvorhersehbare Szenarien von größter Bedeutung ist.

Architekturales Design: System 1 & System 2:

Helixs Architektur spiegelt menschliche kognitive Prozesse wider und ließ sich von Kahnemas "Denk-, schneller und langsamer" Modell inspirieren:

Figure's Helix: AI that Brings Human-Like Robots to your Home - Analytics Vidhya

  • System 2: Das "Big Brain": Dieses 7-Milliarden-Parameter-Vision-Sprache-Modell (VLM) verarbeitet hochgradiges Denken, Sprachverständnis und visuelles Verständnis des visuellen Szenen. Es übersetzt abstrakte Befehle (wie "das Wüstengegenstand aufnehmen") in umsetzbare Schritte.

  • System 1: Präzise Aktionsausführung: Diese visuomotorische Richtlinie mit 80 Millionen Parameter sorgt für eine schnelle Kontrolle mit niedriger Ebene für genaue Aktionen wie Greifen und Objektmanipulation, basierend auf den Anweisungen von System 2. Die kompakte Größe ermöglicht schnelle Echtzeitantworten.

Beide Systeme arbeiten mit einem eingebetteten GPUs mit geringer Leistung, wodurch die Abhängigkeit von externen Computerressourcen beseitigt und den Weg für die kommerzielle Lebensfähigkeit ebnet.

Schlüssel technologische Fortschritte:

  • Unified Neural Network: Helix verwendet ein einzelnes neuronales Netzwerk für alle Verhaltensweisen (Auswahl, Platzierung, Schubladenbetrieb, Kühlung, Multi-Robot-Interaktion), wobei die Notwendigkeit der aufgabenspezifischen Feinabstimmung beseitigt wird.
  • Erstellung des Fliege Verhaltens: Helix erzeugt intelligentes, neuartiges Verhalten für unsichtbare Objekte und minimiert die Notwendigkeit menschlicher Programmierung oder Demonstrationen.
  • kommerzielle Bereitschaft: Die eingebettete GPU-Architektur sorgt für sofortige reale Anwendbarkeit ohne Latenz- und Abhängigkeitsprobleme von Cloud-basierten Systemen.

Demonstrationsvideos:

Abbildung AI zeigt die Funktionen von Helix durch mehrere überzeugende Videos:

  1. kollaborative Lebensmittelspeicherung: Zwei Helix-Roboter speichern gemeinsam unbekannte Lebensmittel, die Koordination und Anpassungsfähigkeit demonstrieren.
  2. Objektmanipulation: Roboter führen verschiedene Aufgaben aus (pflücken, platzieren, Schubladenbetrieb, Kühlschrankinteraktion) basierend auf Befehlen natürlicher Sprache.
  3. Konzeptionelle Argumentation: Helix interpretiert abstrakte Befehle wie "das Wüstengegenstand" und zeigt seine Fähigkeit, Sprache mit physischen Handlungen zu verbinden.

kollaborative Lebensmittelhandhabung:

Dieses Video zeigt zwei Roboter, die von einer einzelnen Helix -Instanz kontrolliert werden und die unterschiedliche, unbekannte Lebensmittelgegenstände effizient speichern. Ihre Koordination, einschließlich der Übergabe von Gegenständen und Platzierung in Schubladen/Behältern, wird von natürlichen Sprachaufforderungen angetrieben ("Hand der Tasche mit Keksen ...", "Legen Sie sie in die offene Schublade"). Dies zeigt die Multi-Robot-Zusammenarbeit von Helix und die Null-Shot-Generalisierungsfunktionen.

Vollkörpermotorsteuerung:

Diese Demonstration zeigt die 35-DOF-Kontrolle von Helix bei 200 Hz. Der Roboter manipuliert Objekte reibungslos und koordiniert seinen gesamten Oberkörper (Oberkörper, Kopf, Handgelenke, Finger) für optimale Reichweite und Präzision. Dies zeigt die Echtzeit-Geschicklichkeit und -stabilität von Helix, die Herausforderungen im Zusammenhang mit hohen DOF-Systemen überwinden.

Sprachgeführte Objektmanipulation:

Dieses Video betont die Fähigkeit von Helix, hochrangige Befehle in genaue Aktionen zu übersetzen. Wenn Helix auf "das Wüstenartikel abholen" reagiert, identifiziert und wählt er einen Spielzeugkaktus aus und zeigt die Fähigkeit, abstraktes Sprachverständnis mit einer komplizierten Motorsteuerung zu verknüpfen.

Zusammenfassung:

Die Helix von

Abbildung Ai repräsentiert einen signifikanten Sprung nach vorne in der humanoiden Robotik. Das innovative VLA-Framework in Verbindung mit seiner Doppelsystemarchitektur und der Verarbeitungsfunktionen an Bord ermöglicht das menschliche Denken und Geschicklichkeit und sorgt dafür, dass sie für reale Anwendungen, insbesondere in häuslichen Umgebungen, ideal geeignet ist. Die Fähigkeit von Helix, natürliche Sprachanweisungen zu verstehen und auf Anweisungen zu reagieren, während sie eine breite Palette von Objekten ohne vorherige Trainingseinziehung abwickeln

Das obige ist der detaillierte Inhalt vonFigure ' S -Helix: KI, die menschliche Roboter in Ihr Zuhause bringt - Analytics Vidhya. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage