


Nach 2 Monaten kann der humanoide Roboter Walker S Kleidung falten
Machine Power Report
Herausgeber: Wu
Mit der Enthüllung von Abbildung 01, die das multimodale Großmodell OpenAI beinhaltet, haben die damit verbundenen Fortschritte inländischer Kollegen Aufmerksamkeit erregt.
Erst gestern veröffentlichte UBTECH, Chinas „erster Bestand an humanoiden Robotern“, die erste Demo des humanoiden Roboters Walker S, nachdem dieser tief in das große Modell von Baidu Wenxin integriert wurde und einige interessante neue Funktionen zeigte.
Jetzt, mit dem Segen der Großmodellfähigkeiten von Baidu Wenxin, sieht Walker S so aus.
Wie Abbildung 01 bewegt sich Walker S nicht umher, sondern steht hinter einem Schreibtisch, um eine Reihe von Aufgaben zu erledigen. Es kann menschlichen Befehlen folgen und Kleidung falten.
Nachdem Sie die Aufgabe erledigt haben, können Sie auch mit ihr chatten. Was soll ich zum Beispiel zu diesem schwarzen Oberteil tragen? Der Roboter merkt sich immer noch, dass Sie auf Geschäftsreise sind, und es wird empfohlen, ihn mit dunklen Hosen zu kombinieren, die für formelle Anlässe besser geeignet sind.
Es werden auch verschiedene Schalter auf dem Tisch in der Platte platziert.
Selbst wenn es gestört wird, z. B. wenn der platzierte Schalter auf den Tisch zurückgeworfen wird oder die gerade erreichbare Steckdose entfernt wird, kann Walker S seinen Arbeitsstatus in Echtzeit anpassen und die Platzierungsaufgabe entsprechend abschließen neue Situation.
Im Februar demonstrierte Walker S bereits multimodale Wahrnehmungs- und Bewegungssteuerungsfähigkeiten während eines praktischen Trainings in einer Fabrik für neue Energiefahrzeuge.
Durch die umfassende Integration mit dem großen Wenxin-Modell haben die kognitiven und Kontrollfähigkeiten von Walker S nicht nur ein erweitertes Absichtsverständnis und feinkörnige Aufgabenplanungsfunktionen erreicht, sondern auch komplexe Flexibilität erreicht Falten von Kleidung zum ersten Mal.
Das große Wenxin-Modell ist das große Modell zur Wissenserweiterung auf industrieller Ebene von Wenxin, das über modal- und sprachübergreifende Funktionen für tiefes semantisches Verständnis und Generierung sowie Wissensbegründung, Aufgabenplanung und andere Funktionen verfügt. Durch die Übertragung dieser Fähigkeiten auf humanoide Roboter kann der Roboter wie Menschen das Material, die Form, Falten und andere Eigenschaften von Kleidung analysieren und verstehen und auf der Grundlage früherer Erfahrungen die beste Art und Reihenfolge zum Falten von Kleidung ableiten. Während des eigentlichen Prozesses des Faltens der Kleidung analysiert der Roboter in Echtzeit die Zustandsänderungen der Kleidung und passt seine Aktionsstrategie entsprechend an.
Bei der Aufgabe zur Sortierung von Objektinterferenzen nutzte Walker S auch die synergetischen Vorteile von „KI großes Modell + Roboter“ voll aus. Zunächst werden die räumlichen Positionierungs- und semantischen Informationen des Objekts über das multimodale Wahrnehmungsmodell auf dem Gerät ermittelt und dann zur intelligenten Verarbeitung an das große Modell übergeben. Letzteres baut Walker S mit seiner hervorragenden Aufgabenzerlegung schnell auf und logisches Denken. Finden Sie den optimalen Weg zur Aufgabenplanung und -ausführung. Walker S ordnet diese Lösung der tatsächlichen Steuerung des Roboterarms und der geschickten Hände zu und erledigt schließlich die gesamte Reihe komplexer Aufgaben erfolgreich.
Dies ist auch die erste Demonstration ähnlicher Fähigkeiten durch inländische Kollegen. Seine innovative Anwendung und Implementierungsschwierigkeit gehören ebenfalls zu den ersten in der Branche weltweit. „Bei vielen Demonstrationen, einschließlich der Zusammenarbeit von Figure mit OpenAI und unserer Zusammenarbeit mit Baidu, kann nun eine End-to-End-Lösung erreicht werden“, sagte das UBTECH-Management gestern Abend bei der Leistungsbeurteilung und dem Ausblick.
" Wir verwenden die großen Modelle von Baidu, um Aufgaben zu zerlegen, natürliche Sprache zu verstehen und logische Anordnungen zu sequenzieren. Zusätzlich zu dem multimodalen großen Modell, das auf dem Kunden basiert und letztes Jahr auf der Basis von Open-Source-Modellschulungen erstellt wurde, glauben wir, dass in der „Da der Wettbewerb auf dem Markt für humanoide Roboter immer härter wird, können wir 1+1>2 erreichen.“ Wir können sehen, dass die Zusammenarbeit eine starke technische Unterstützung für die Implementierung humanoider Roboter bieten kann. „Durch den Vergleich der Videos von OpenAI haben wir jedoch festgestellt, dass es immer noch eine Lücke zwischen dem befähigten Walker S und Abbildung 01 gibt.“
Das offensichtlichste ist die Geschwindigkeit der Aktion. Darüber hinaus sind die von Walker S erhaltenen Anweisungen in Bezug auf den Inhalt der Anweisungen normalerweise relativ klar und spezifisch, während Abbildung 01 abstraktere Anweisungen durch vernünftiges Denken in vernünftige und realisierbare spezifische Operationen umwandeln kann.
Darüber hinaus kann Abbildung 01 während der Arbeit chatten (insbesondere seine Vorgänge erklären), verfügt über ein Kurzzeitgedächtnis und kann aktuelle Aktionen basierend auf dem Inhalt früherer Gespräche vernünftig planen.
Da der Wettbewerb in der generativen KI immer härter wird und sich der Forschungsschwerpunkt von Langtext und Multimodalität bis hin zu verkörperter Intelligenz erstreckt, haben wir Grund zu der Annahme, dass zukünftige humanoide Roboter nicht mehr nur auf die Wahrnehmung statischer Daten beschränkt sein werden, sondern dies auch tun werden Sie können sich in der realen dreidimensionalen Welt frei bewegen und mit der Umgebung interagieren. Dies markiert auch einen großen Sprung in der KI vom einfachen maschinellen Lernen zur Ausführung komplexer menschenähnlicher Aufgaben.
Tatsächlich hat die Rennstrecke für humanoide Roboter in den letzten sechs Monaten eine äußerst starke Dynamik gezeigt, wobei häufig Prototypen im In- und Ausland vorgestellt wurden und Startups aktiv finanziert wurden. Im Februar veröffentlichte UBTECH ein Video, in dem Walker S in der neuen Energiefahrzeugfabrik von NIO getestet wird. Der Roboter kann die Sicherheitsgurtprüfung, das Anbringen von Fahrzeuglogos und andere Aufgaben problemlos erledigen. Auch der Aktienkurs von UBTECH stieg Anfang März innerhalb von zwei Tagen um 200 %.
Allerdings befinden sich humanoide Roboter auf der ganzen Welt noch im Pilotstadium und es wird noch einige Zeit dauern, sie zu skalieren. Schließlich gibt es einen großen Unterschied zwischen Demo und tatsächlicher Anwendung, und letztere muss eine Reihe von Faktoren wie Zuverlässigkeit, Stabilität und Kosten umfassend berücksichtigen. UBTECH gab an, dass die Kombination aus großen KI-Modellen und humanoiden Robotern deren Intelligenzniveau und Anpassungsfähigkeit an Multiszenario-Aufgaben erheblich verbessern und ihren Industrialisierungsprozess beschleunigen werde. Gründer Zhou Jian erklärte außerdem öffentlich, dass er hofft, bis Ende dieses Jahres die erste Charge humanoider Roboter in der Fabrik fertigzustellen, die Tests zu bestehen und sich auf den Massenausbruch humanoider Roboter im Jahr 2025 vorzubereiten. Darüber hinaus plant UBTECH, bis Ende dieses Jahres den humanoiden Roboter der ersten Generation für die häusliche emotionale Pflege auf den Markt zu bringen. Der Roboter wird mit einem großen Modell ausgestattet sein und mit Benutzern interagieren und Kurz- und Langzeitgedächtnisse bilden.
Referenzlink
https://www.stcn.com/article/detail/1164967.html
DAS ENDE
Bitte wenden Sie sich an dieses öffentliche Konto, um die Genehmigung zum Nachdruck zu erhalten.
Mitwirken oder Berichte anfordern: content@jiqizhixin.com
Das obige ist der detaillierte Inhalt vonNach 2 Monaten kann der humanoide Roboter Walker S Kleidung falten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Es gibt viele Möglichkeiten, Bootstrap -Bilder zu zentrieren, und Sie müssen keine Flexbox verwenden. Wenn Sie nur horizontal zentrieren müssen, reicht die Text-Center-Klasse aus. Wenn Sie vertikal oder mehrere Elemente zentrieren müssen, ist Flexbox oder Grid besser geeignet. Flexbox ist weniger kompatibel und kann die Komplexität erhöhen, während das Netz leistungsfähiger ist und höhere Lernkosten hat. Bei der Auswahl einer Methode sollten Sie die Vor- und Nachteile abwägen und die am besten geeignete Methode entsprechend Ihren Anforderungen und Vorlieben auswählen.

Die Berechnung von C35 ist im Wesentlichen kombinatorische Mathematik, die die Anzahl der aus 3 von 5 Elementen ausgewählten Kombinationen darstellt. Die Berechnungsformel lautet C53 = 5! / (3! * 2!), Was direkt durch Schleifen berechnet werden kann, um die Effizienz zu verbessern und Überlauf zu vermeiden. Darüber hinaus ist das Verständnis der Art von Kombinationen und Beherrschen effizienter Berechnungsmethoden von entscheidender Bedeutung, um viele Probleme in den Bereichen Wahrscheinlichkeitsstatistik, Kryptographie, Algorithmus -Design usw. zu lösen.

Kompatibilitätsprobleme und Fehlerbehebungsmethoden für Unternehmenssicherheit und Anwendung von Unternehmenssicherheit. Viele Unternehmen werden Sicherheitssoftware installieren, um die Sicherheit der Intranet zu gewährleisten. Sicherheitssoftware jedoch manchmal ...

STD :: Einzigartige Entfernung benachbarte doppelte Elemente im Container und bewegt sie bis zum Ende, wodurch ein Iterator auf das erste doppelte Element zeigt. STD :: Distanz berechnet den Abstand zwischen zwei Iteratoren, dh die Anzahl der Elemente, auf die sie hinweisen. Diese beiden Funktionen sind nützlich, um den Code zu optimieren und die Effizienz zu verbessern, aber es gibt auch einige Fallstricke, auf die geachtet werden muss, wie z. STD :: Distanz ist im Umgang mit nicht randomischen Zugriffs-Iteratoren weniger effizient. Indem Sie diese Funktionen und Best Practices beherrschen, können Sie die Leistung dieser beiden Funktionen voll ausnutzen.

Der ad-axis-Position adaptive Algorithmus für Webanmerkungen In diesem Artikel wird untersucht, wie Annotationsfunktionen ähnlich wie Word-Dokumente implementiert werden, insbesondere wie man mit dem Intervall zwischen Anmerkungen umgeht ...

Detaillierte Erläuterung der zweidimensionalen Sortier- und Ranking-Implementierung von PHP-PHP In diesem Artikel wird ausführlich erläutert, wie ein zweidimensionales PHP-Array sortiert und jedes Sub-Array gemäß den Sortierergebnissen verwendet wird ...

Diskussion über die Verwendung benutzerdefinierter Stylesheets in Safari heute Wir werden eine Frage zur Anwendung von benutzerdefinierten Stylesheets für Safari Browser diskutieren. Front-End-Anfänger ...

Wie optimieren Sie die Jieba -Word -Segmentierung, um die Keyword -Extraktion von malerischen Spot -Kommentaren zu verbessern? Bei Verwendung von Jieba -Word -Segmentierung zur Verarbeitung szenischer Spot -Kommentardaten, wenn die Ergebnisse der Wortsegmentierung ignoriert werden ...
