Die Menschheit leitet ein explosives Update auf dem Gebiet der künstlichen Intelligenz ein. Fast jeder Schritt bei der Ausweitung der Technologie ins Unbekannte hat erstaunliche Aufmerksamkeit erregt.
Im Prozess der Erweiterung der Grenzen der künstlichen Intelligenz koexistieren Innovation und Meinungsverschiedenheit auf den technischen Strecken wichtiger Strecken. Das Urteilsvermögen und die Entscheidungen von Technologiepionieren beeinflussen die Fußstapfen vieler Anhänger.
Im vergangenen Jahr hat diese Website ausschließlich die Führung übernommen und herausragende Unternehmen wie Dark Side of the Moon, Shengshu Technology, Aishi Technology und Wuwen Core Dome allen vorgestellt und ihnen das erste „10.000-Wörter-Interview-Skript“ hinterlassen " in der Internetwelt. ". In einer Phase, in der die Technologiewege noch nicht konvergiert sind, sehen wir die Führung von KI-Unternehmern, die wirklich über Vertrauen, Mut und systematische Erkenntnis verfügen.
Daher haben wir die Kolumne „KI-Pioniere“ ins Leben gerufen, in der Hoffnung, weiterhin Unternehmer mit Führungsqualitäten in verschiedenen Unterbereichen der künstlichen Intelligenz im AGI-Zeitalter zu finden und zu erfassen und die herausragendsten und vielversprechendsten Start-ups im KI-Bereich vorzustellen verfolgen und teilen Sie ihre Erfolge im Rahmen des modernsten und markantesten Wissens auf dem Gebiet der KI. ... überraschend jung.
Yang Fengyu, Student der Informatik an der University of Michigan und Doktorand der Informatik an der Yale University, ist erst 23 Jahre alt und gründete letztes Jahr sein eigenes Unternehmen für intelligente Roboter. Im Jahr 2024 schloss das von ihm gegründete KI-Unternehmen UniX die Entwicklung und Herstellung eines humanoiden Roboters mit Rädern innerhalb von fünf Monaten ab. Dieser Roboter verfügt über Funktionen wie „Reinigung nach dem Essen“ und „Wäsche“. Die Massenproduktion und der externe Verkauf werden beginnen im September. Während sich viele verkörperte intelligente Roboter noch im Laborstadium befinden, ist dies eine sehr schnelle Kommerzialisierungsgeschwindigkeit. In Suzhou hat die Roboter-Massenproduktionsfabrik von UniX AI eine Fläche von mehr als 2.500 Quadratmetern erreicht.
Dieses Unternehmen, von dem letztes Jahr fast niemand etwas gehört hatte, hat innerhalb eines halben Jahres viele hochrangige technische Talente in der Robotikbranche rekrutiert. „Der Forschungs- und Entwicklungsleiter des Hauptserviceroboters hilft uns bei der Herstellung des Chassis, und es gibt auch einige Top-Talente des Unternehmens für humanoide Roboter, die für unsere Hardware verantwortlich sind.“ Im Juli 2024 gab Professor Wang Hesheng, ein bekannter Robotikexperte der Shanghai Jiao Tong University, bekannt, dass er offiziell als Chefwissenschaftler zu UniX AI wechseln wird. Im ersten von UniX AI veröffentlichten Technologiedemonstrationsvideo kann ein humanoider Roboter mit Rädern namens Wanda Aufgaben wie das Greifen von Tofu, das Helfen beim Sortieren von Kleidung und das Bringen von Kleidung zur Reinigung in eine Waschmaschine erledigen. UniX AI scheint eine Lösung für das Problem der „flexiblen Aufgaben“ gefunden zu haben, das derzeit für verkörperte Geheimdienstunternehmen schwer zu lösen ist. „Ich glaube nicht, dass es falsch ist, jung zu sein. Aus technischer Sicht werden viele neue Technologien und Produkte von jungen Menschen mit starkem akademischen Hintergrund entwickelt, als Generation nach 2000.“ Yang Fengyu selbst zeigt in seinen Gesprächen eine über sein Alter hinausgehende Reife und verfügt über ein sehr klares Verständnis der Unternehmensführung und der technischen Stufe der verkörperten Intelligenz. Unsere Neugier auf UniX AI konzentriert sich darauf, wie ein verkörpertes Geheimdienstunternehmen mit fast keinen Nachrichten im Risikokapitalkreis eine so schnelle Entwicklungsgeschwindigkeit erreichen kann, als eines der wenigen Unternehmen, die von einem verkörperten Geheimdienstunternehmen der Generation nach den 2000er Jahren gegründet wurden. Wie erreicht UniX AI eine Entwicklung von 0 auf 1? Wie sieht die endgültige Roadmap von UniX AI für verkörperte Intelligenz aus? Mit diesen Fragen im Hinterkopf startete diese Website den ersten öffentlichen Mediendialog mit Yang Fengyu seit der Gründung seines Unternehmens.
Yale Post-00s Beitritt zum Embodied Intelligent Entrepreneurship
Diese Seite: Haben Sie jetzt Ihren Abschluss gemacht? Yang Fengyu: Ich bin als Student direkt nach Yale gegangen und habe im Grunde alle Anforderungen für meine Doktorarbeit erfüllt. Dieses Jahr habe ich zum Beispiel vier CVPR-Arbeiten gewonnen, und es gibt noch mehr Insgesamt zehn Vorträge zu den Themen Künstliche Intelligenz und Robotik. Diese Seite: Deine Energie ist sehr stark. Yang Fengyu: (lachend), ich bleibe oft bis 3:30 Uhr morgens wach und habe mir vor einiger Zeit sogar eine Diabetikerspritze holen lassen. Vor allem, weil das Team zusammen ist und wir oft nicht auf die Uhr schauen. Wenn wir aufschauen, ist es schon sehr spät. Diese Seite: Wann haben Sie zum ersten Mal daran gedacht, ein Unternehmen zu gründen? Yang Fengyu: Ich habe immer geglaubt, dass es beim Unternehmertum um „die richtige Zeit, den richtigen Ort, die richtigen Leute“ geht. Letztes Jahr haben wir große Fortschritte in der Technologie auf der Wahrnehmungsebene gesehen. Einige große Modelle oder Basismodelle, einschließlich multimodaler Modelle wie Vision, Sprachmodelle und Berührung, haben große Fortschritte gemacht Ihre Ziele zu erreichen. Darüber hinaus hat das Land eine Reihe von Fördermaßnahmen eingeführt, um ein gutes Umfeld für Unternehmertum zu schaffen. Dies ist „der richtige Zeitpunkt“. „Schlechter Standort“: Es besteht kein Zweifel daran, dass universelle humanoide Roboter die nächste Entwicklungsrichtung sind, nachdem China beispiellose Vorteile in der Lieferkette und der Hochtechnologie im Jangtse-Delta hat Es gibt auch viele Talente. Zu Beginn haben wir einige Nachforschungen angestellt, um herauszufinden, wie weit das technische Niveau der Roboterindustrie fortgeschritten ist, wo die Marktnachfrage ist, welche Probleme die vorherige Robotergeneration gelöst hat und wo ihre Zukunft liegt Gelegenheiten? Der Schlüssel zum Erfolg liegt darin, die richtige Person zu finden. In diesem Jahr haben wir offiziell ein Team gebildet und schnell Experten aus vielen Bereichen zusammengestellt, darunter den Forschungs- und Entwicklungsleiter des kopfmontierten Kehrroboters sowie einige Top-Talente des Unternehmens für kopfhumanoide Roboter, die für unsere Hardware verantwortlich sind. Auf Algorithmenebene habe ich eine Gruppe von Talenten in den USA und Europa rekrutiert, darunter einige meiner Klassenkameraden und Senioren. Das ist „Menschlichkeit“. Als Gründer und CEO ist es das Wichtigste, Ressourcen zu sammeln. UniX AI ist ein globales Unternehmen, das die Vorteile von Robotersoftware, -hardware und -lieferkette aus verschiedenen Ländern auf der ganzen Welt vereint. Gleichzeitig haben wir einen internationalen Plan, durch kontinuierliche Bemühungen in einem Jahr, drei Jahren und Fünfjahrespläne zur Verwirklichung der Unternehmensvision „Robots For All“.Diese Seite: Stellen Sie kurz Ihre akademischen Erfahrungen vorYang Fengyu: Ich bin in China von der Grundschule zur weiterführenden Schule gegangen und habe an der University of Michigan Informatik studiert, um dort meinen Bachelor-Abschluss zu machen . Zuerst kam ich mit Vision und maschinellem Lernen in Kontakt. Später begann ich unter dem Einfluss des „multimodalen Lernens“ meines Mentors, visuelle und taktile Forschung zu betreiben. Ich habe während meiner Studienzeit 5 Artikel über visuelle und taktile Wahrnehmungen von Robotern veröffentlicht. Unter ihnen ist „Touch and Go: Learning from Human-Collected Vision and Touch“ der weltweit größte Datensatz zur visuellen und taktilen Wahrnehmung. wurde von künstlicher Intelligenz verwendet und von NuerIPS, der Top-Konferenz im Bereich maschinelles Lernen, akzeptiert. In einer anderen Arbeit haben wir zum ersten Mal das Diffusionsmodell eingeführt, um die gegenseitige Transformation zwischen Sehen und Fühlen zu vervollständigen, und die Ergebnisse wurden von ICCV akzeptiert. Für Roboter ist Berührung sehr wichtig. Ob ein Kleidungsstück aus Polyester, Baumwolle oder Seide besteht, lässt sich mit bloßem Auge nur schwer erkennen. Darüber hinaus erfordern einige heikle Tätigkeiten, wie das Einstecken des Ladekabels in den Ladeanschluss, auch eine kontinuierliche Anpassung durch Berührung, die nicht allein durch das Sehen erledigt werden kann. Diese Seite: Dann bist du nach Yale gekommen. Yang Fengyu: Aufgrund einiger Arbeiten zu den visuellen und taktilen Aspekten von Robotern, insbesondere der Transformation visueller und taktiler Empfindungen und ihrer Verallgemeinerung in großen Sprachmodellen, habe ich den Titel „Outstanding Undergraduate Scientist“ aus Nordamerika gewonnen Computer Society, die erste in der Geschichte der Schule. Schließlich wählte er die Yale University für sein Doktoratsstudium. Während dieser Zeit habe ich nacheinander einige Artikel veröffentlicht, darunter „Binding touch to everything: Learning einheitliche multimodale taktile Darstellungen“ (CVPR, 2024, S. 26340-26353). Das weltweit erste große Tastmodell, das für mehrere verschiedene Tastsensoren geeignet ist, eignet sich für visionsbasierte Tastsensoren, die mit mehreren Modalitäten wie Sehen, Sprache und Ton verbunden sind. Ein weiterer Artikel „Tactile-Augmented Radiance Fields“ (CVPR, 2024, S. 26529-26539) etablierte das weltweit erste visuelle und taktile 3D-Modell TARF, das auf Szenenebene verallgemeinert werden kann Auch der humanoide KI-Roboter basiert auf diesem Modell.
Diese Seite: Glauben Sie, dass es für Sie vorteilhafter oder nachteiliger ist, nach 2000 geboren zu sein? Yang Fengyu: In einem Startup-Unternehmen ist der Gründer die Seele. Viele Leute denken, ich sei sehr jung, aber ich denke, dass es kein Problem ist, in den 2000ern geboren zu sein.
Aus technischer Sicht spielen junge Menschen eine sehr starke treibende Rolle dabei, diese Welle des technologischen Wandels zu begrüßen und Innovationen zu verfolgen. Viele neue Technologien und Produkte werden von den jungen Menschen von heute entwickelt, insbesondere in High-Tech-Branchen, wo die Einstiegsschwelle relativ hoch ist. Einer der Mitglieder von Soras Kernteam ist auch mein Klassenkamerad. Er zeigte starke technische Fähigkeiten, als er an der University of Michigan war. Auf kognitiver und Erfahrungsebene denke ich, dass schnelles Lernen und schnelles Korrigieren von Fehlern auch ein Weg ist. Das andere ist die Persönlichkeit. Sie müssen bereit sein, durchzuhalten und belastbar zu sein, nichts unversucht zu lassen und den Geist haben, „Wege zu öffnen, wenn Sie auf Berge stoßen, und Brücken zu bauen, wenn Sie auf Gewässer stoßen“. . Natürlich gibt es auch viele erfahrene Experten im UniX AI-Team. Sie verfügen über umfangreiche Erfahrungen in den Bereichen Strukturen, Elektronik usw. Nur durch eine effektive Zusammenarbeit zwischen uns können wir unsere Produkte in kurzer Zeit auf den Markt bringen.
Visuell und taktil + Bedienung Verbesserung der Generalisierungsfähigkeit von Robotern
Diese Seite: Warum ist die Verbesserung des Tastsinns für Roboter wichtig? Menschen sind multisensorische Tiere. Ihre Handlungsentscheidungen sind normalerweise der kombinierte Einfluss von Informationen, die von mehreren Sinnen übermittelt werden. Das Gleiche gilt theoretisch für intelligente Roboter. Tippen ist eine der wichtigsten sensorischen Informationen. Im Vergleich zu visuellem Feedback wird es erzeugt, nachdem der Roboter mit der Umgebung interagiert, während visuelles Feedback vorher erfolgt. Wenn der Roboter ein Objekt ergreift, verformt sich das Objekt im Wesentlichen, nachdem diese Interaktion stattgefunden hat, stammen die inkrementellen Informationen, die der Roboter erhält, aus der Berührung – wie es sich anfühlt. Mit taktilen Informationen kann der Roboter einige komplexere und heiklere Aufgaben besser bewältigen, was die Erfolgsquote bei Greifaufgaben erheblich verbessert. Besonders beim Greifen flexibler Objekte ist die Rolle der Berührung offensichtlicher Man kann sagen, dass es sich um eine qualitative Verbesserung von der grundsätzlichen Unmöglichkeit, die Aufgabe zu erledigen, hin zur Fähigkeit, die Aufgabe zu erledigen, handelt. Zum Beispiel hat unser fahrbarer humanoider Roboter Wanda Aufgaben wie das Kneifen von Eiern, das Greifen von Tofu und das Waschen von Kleidung erledigt. Ohne Rückmeldung ist es für den Roboter schwierig, diese auszuführen.
Der Grund dafür, dass Roboter heute hauptsächlich auf das Sehen angewiesen sind, um Urteile zu fällen, liegt daran, dass visuelle Daten im Vergleich zu anderen Daten am direktesten sind, am einfachsten zu erhalten und zu trainieren sind und eine große Datenmenge verfügbar ist. Aber wenn sich der Roboter weiter der Verkörperung nähert, reicht es definitiv nicht aus, sich nur auf das Sehen zu verlassen. Als eine Art sensorischer Information, die auf Interaktion beruht, liegt die Bedeutung der sinnvollen Nutzung taktiler Informationen darin, dass der Roboter nach und nach aus der realen Interaktion mit der Welt lernen und nutzbarer und allgemeiner werden kann. Diese Seite: Warum verbessert sich die Kontrolle des Roboters über flexible Objekte, nachdem er den Tastsinn hinzugefügt hat? Was ist das Prinzip? Yang Fengyu: Das Hauptprinzip besteht darin, dass es einen großen Unterschied beim Greifen und Bedienen flexibler und starrer Objekte gibt. Die physische Form eines starren Objekts ändert sich vor und nach der Berührung grundsätzlich nicht, sodass sie beim Erfassen durch visuelle Beobachtung relativ leicht zu beurteilen ist. Es ist jedoch schwierig zu bestimmen, was nach dem Kontakt mit einem flexiblen Objekt passiert, indem man es vor dem Ergreifen oder Betätigen beobachtet, da während des Greifvorgangs eine große Anzahl von Verschlüssen und Verformungen auftreten und diese Verformungen mit dem Sehvermögen nur schwer genau vorherzusagen sind . von. Wenn Sie beispielsweise ein Taschentuch in der Hand halten, blockiert es die Sichtlinie vollständig. Zu diesem Zeitpunkt kann das Sehvermögen kaum wirksame Informationen liefern, um zu beurteilen, wie man es greift oder bedient. In diesem Fall können wir uns nur auf physische Informationen wie Berührungen verlassen, um die Wahrnehmung zu vervollständigen. Diese Seite: Warum scheint es, dass ich die meiste Zeit nicht versuchen muss, einen Gegenstand zu greifen, ich weiß nur, wie ich ihn greife? Yang Fengyu: Das liegt daran, dass man als Mensch so gut integriert wurde, dass man nicht merkt, dass man darin taktile Informationen verwendet hat. Sie haben über mehr als zwanzig Jahre taktile Daten gesammelt und wissen daher nicht, welcher Sinn Sie bei der Bewältigung dieser Aufgabe unterstützt hat. Diese Seite: Was ist bei den meisten Roboteraufgaben der Unterschied im Beitragsverhältnis verschiedener Sinne? Wie hoch ist in dieser Phase die Priorität der Berührung? Yang Fengyu: Bei den meisten Roboteraufgaben sind die Beitragsanteile verschiedener Sinne in den drei Schritten Wahrnehmung, Argumentation, Entscheidungsfindung und Handeln unterschiedlich. Auf der Wahrnehmungsebene verließen wir uns in der Anfangsphase hauptsächlich auf Vision und Punktwolke, um globale Informationen zu erhalten, z. B. um den Grundriss des gesamten Hauses zu kennen, wo sich das Wasser befindet usw. Derzeit ist das Problem der Wahrnehmung globaler Informationen durch große visuelle Modelle und große 3D-Modelle grundsätzlich gelöst. Auf der Entscheidungsebene wird vor allem auf die Sprache zurückgegriffen, um menschliches Vorwissen einzubringen. Nachdem der Roboter beispielsweise die Anweisung erhalten hat, Wasser aus dem Kühlschrank zu holen, kann er die Aufgabe aufschlüsseln und den ersten Schritt zum Öffnen des Kühlschranks, den zweiten Schritt zum Holen von Wasser und den dritten Schritt zum Schließen des Kühlschranks kennen Wissen stammt aus einer großen Menge an Internetdaten. Auf der Aktionsebene kann das Sehen dem Roboter dabei helfen, die Greifposition zu bestimmen. Aber bei der Bestimmung der Greifstärke spielen taktile Informationen eine wichtige Rolle. Wenn beispielsweise eine Okklusion vorliegt, etwa beim Halten von Tofu, ist es schwierig, die Greifmethode durch das Sehen genau zu beurteilen, aber die taktile Empfindung kann wichtige Informationen liefern, die dem Roboter dabei helfen, das präzise Greifen durchzuführen. Darüber hinaus spielt Berührung in einigen Szenen mit feiner Kraftkontrolle eine wichtige Rolle, wie z. B. beim Kneifen von Eiern, beim Greifen von Tofu usw., sowie in einigen Szenen, in denen eine Beurteilung der Objektverformung und Kraftrückmeldung erforderlich ist.
Im Allgemeinen variiert das Beitragsverhältnis verschiedener Sinne je nach Aufgabe. Beim Erfassen einiger starrer Objekte kann das Sehen einen höheren Anteil ausmachen, während beim Erfassen vieler flexibler Objekte die Rolle der Berührung wichtiger ist. und sogar Es kann gesagt werden, dass es sich um eine qualitative Verbesserung handelt, von der grundsätzlichen Unfähigkeit, die Aufgabe zu erledigen, zur Fähigkeit, die Aufgabe zu erledigen. Diese Seite: Gibt es ausreichend hohe Barrieren zum Berühren? Welche Schwierigkeiten gibt es bei der Umsetzung in Roboterprodukte? Yang Fengyu: Ich denke, dass Berührungen vor 2023 immer eine sehr Nischenmethode waren. Im Vergleich zu Sehen und Hören beschäftigten sich nur sehr wenige Menschen mit berührungsbezogenen Arbeiten. In den Anfängen der haptischen Arbeit waren Sensoren das größte Problem. Zu dieser Zeit gab es auf der Welt nicht viele Menschen, die sich mit datenbezogenen Arbeiten beschäftigten, und die Herstellung von Sensoren war ein zentrales Thema. Zweitens stellt sich die Frage, wie taktile Informationen analysiert werden können, was sowohl Algorithmus- als auch Datenebene betrifft. Auf der Datenebene wurden die meisten spezifischen Daten der taktilen Sensorik weltweit noch nicht veröffentlicht. Dies kann an der Besonderheit der Kombination vieler Roboter oder anderen Gründen liegen, die die Datenoffenlegung vor Ort erschweren der Robotik weniger als im Sichtfeld. Deshalb lösen wir weiterhin das Problem der Datensätze und setzen uns dafür ein, die kontinuierliche Offenlegung von Datensätzen zur Tasterfassung auf der ganzen Welt zu fördern. Auf Algorithmusebene gibt es Unterschiede zwischen Tastsinn und Sehsinn, die viel Vorwissen der Physik beinhalten. Zum Beispiel kann die Kraftsituation durch Markierungen auf dem Sensor beurteilt werden, diese Informationen sind jedoch nicht so einfach zu interpretieren und zu identifizieren wie visuelle Informationen. Zu dieser Zeit wurde auch ein Experiment durchgeführt, und die Ergebnisse zeigten, dass die erzeugten taktilen Signale für Menschen sehr schwer zu unterscheiden waren. Weil es für Menschen ohne spezielle Schulung schwierig ist, die taktilen Sinnessignale der einzelnen Dinge zu unterscheiden. Wir arbeiten auch aktiv daran, diese Hürde abzubauen und mehr Menschen in der akademischen Gemeinschaft dazu zu bewegen, sich daran zu beteiligen, um die Entwicklung und den Fortschritt des gesamten taktilen Bereichs zu fördern. Diese Seite: Wenn taktile Informationen nicht nur mit dem Problem kleiner Mengen vorhandener Daten konfrontiert sind, sondern auch mit den hohen Kosten einer groß angelegten Sammlung, wie kann man sie dann vergrößern? Yang Fengyu: Die Arbeit, die wir vorher gemacht haben, bestand eigentlich darin, zu versuchen, dieses Problem zu lösen, wie man es vergrößern kann, wenn eine groß angelegte Sammlung schwierig zu erreichen ist: Der erste Schritt besteht darin, Visionen zu kombinieren und Berührung Durchkommen, taktile Empfindungen durch Sehen vorhersagen und sogar visuelle und sprachliche Informationen verwenden, um taktile Signale in Szenen ohne taktile Erfassung abzuleiten. Nachdem Sie beispielsweise die taktilen Informationen von Tischen des gleichen Typs und des gleichen Materials in einer neuen Wohn- oder Büroszene gesammelt haben, können Sie auf seine taktilen Signale durch visuelle und visuelle Rückschlüsse schließen, selbst wenn Sie den neuen Tisch nicht tatsächlich berührt haben verbale Informationen. So können wir den verfügbaren Datensatz auch ohne echten Körperkontakt erweitern. Diese Methode kann jedoch etwas vom tatsächlichen Signal abweichen, da es vorhergesagt wird. Zweitens fördern wir weiterhin die Offenlegung taktiler Datensätze. Durch die Veröffentlichung des Datensatzes können mehr Menschen an der Forschung und Entwicklung des haptischen Bereichs teilnehmen und so den Fortschritt des gesamten Bereichs fördern. Drittens streben wir auf Algorithmusebene danach, die Schwelle für die taktile Informationserkennung zu senken. Indem wir beispielsweise Markierungen zum Sensor hinzufügen und herausfinden, wie sich die Markierungen verändern, wenn sie unterschiedlichen Kräften ausgesetzt werden, können wir diese Vorkenntnisse der Physik nutzen, um taktile Informationen besser zu analysieren. Viertens sind wir bestrebt, verschiedene Informationen wie visuelle, taktile, sprachliche und andere multimodale Informationen zu kombinieren, um verschiedene Aufgaben zu erledigen. Durch die Fusion multimodaler Informationen kann der Mangel an geringen Mengen taktiler Daten bis zu einem gewissen Grad ausgeglichen und die Generalisierungsfähigkeit und Anpassungsfähigkeit des Modells verbessert werden. Diese Seite: Ist eine groß angelegte Sammlung möglich und welche Bedingungen sind erforderlich? Yang Fengyu: Ich denke, dass dies tatsächlich der Engpass bei der gesamten Entwicklung der verkörperten Intelligenz ist. Ich persönlich denke, dass eine groß angelegte Sammlung erreicht werden kann, aber hier gibt es einen Kommerzialisierungsprozess. Wenn Roboter in Tausende von Haushalten eindringen, können Sie ab einer bestimmten Anzahl genügend Daten sammeln, um weitere Szenarien zu unterstützen und einige Verallgemeinerungen vorzunehmen. Natürlich kann man nicht jeden Punkt für immer erfassen, daher wird es immer den Vorschlag eines „großen Maßstabs“ geben. Der Kern des maschinellen Lernens besteht darin, durch spärliche Stichproben eine Simulationsanpassung und Vorhersage einer dichten Verteilung zu erreichen. Was die Daten betrifft, schließen wir Simulationen nicht aus, aber ich denke, dass eine gewisse Menge realer Maschinendaten eine notwendige Voraussetzung für die Realisierung verkörperter Intelligenz ist. Diese Seite: Was sind die wichtigsten technischen Indikatoren des taktilen Großmodells? Yang Fengyu: Wie jedes große Modell verfügt auch das taktile große Modell über einige Indikatoren für verschiedene nachgelagerte Aufgaben. Ich leitete das Team beim Aufbau des weltweit größten bestehenden visuellen und taktilen Datensatzes, Touch and Go, der weltweit einer der wichtigsten gemeinsamen Benchmarks für visuelle und taktile Robotermodelle vor dem Training darstellt.
Verkörperter intelligenter Roboter Wanda Starten Sie die Massenproduktion im September
Diese Seite: Nachdem Sie sich entschieden haben, ein Unternehmen zu gründen, welche Art von verkörpertem Intelligenzunternehmen planen Sie aufzubauen? Yang Fengyu: Die Essenz des Unternehmertums besteht darin, Werte für die Gesellschaft zu schaffen. UniX AI ist eines der wenigen Unternehmen für verkörperte intelligente Roboter auf der Welt, das die C-Seite als erste Strategie festlegt. TO C Obwohl noch ein weiter Weg vor uns liegt, ist das Potenzial dahinter riesig. Aus industrieller Sicht sind humanoide Roboter in eine Phase der technologischen Integration von Hardware + KI eingetreten, entwickeln sich rasant und werden immer praktischer. Und ich bin optimistisch, dass dieser Integrationsprozess viel schneller vonstatten gehen wird, als ursprünglich von Brancheninsidern erwartet. Die alternde Bevölkerung, niedrige Geburtenraten, Arbeitskräftemangel ... das sind Probleme, mit denen die Welt konfrontiert ist. Die Verantwortung eines Unternehmens besteht darin, Probleme für die Gesellschaft zu lösen. Dies ist die Chance und der Wert von UniX AI, und es ist auch meine ursprüngliche Absicht, ein Unternehmen zu gründen. Der aktuelle grobe Landepfad dieser Strecke ist im Wesentlichen Industrie-Gewerbe-Heim. Wir werden Geschäft und Heim abdecken, was auch das Hauptszenario für die Bedienung von TO C-Benutzern ist. Die Vision von UniX AI ist Robots For All, die Schaffung universeller humanoider Roboter, die in Bezug auf sportliche Fähigkeiten und Intelligenz führend sind und körperliche Arbeit und intelligente Kameradschaft ermöglichen. Diese Seite: Warum hast du dich überhaupt dafür entschieden, Familienszenen zu drehen? Yang Fengyu: Tatsächlich beschränken wir uns nicht nur auf Familienszenen, sondern machen auch pankommerzielle Szenen wie Büros usw. Das B-Szenario ist technisch relativ weniger schwierig, hat eine hohe Wiederholungsrate und stellt keine so hohen Anforderungen an die Verallgemeinerung. Allerdings beinhalten To-B-Szenarien oft eine starke Substitutionslogik, die sehr hohe Anforderungen an die Geschwindigkeit und Bediengenauigkeit des Roboters stellt. Familienszenen sind komplex und verändern sich ständig. Jedes Zuhause ist ein kleines Ökosystem, das starke Generalisierungsfähigkeiten von Robotern erfordert. Dies stellt natürlich höhere Anforderungen an unsere Produkte. Gleichzeitig werden wir auch in Heimszenarien über viele L2-Level-Funktionen verfügen, was die Anpassungsfähigkeit und Spielbarkeit des Produkts in komplexen Szenarien weiter verbessern wird.
Im Allgemeinen kann unser Technologie-Stack sowohl To B als auch To C abdecken. Sobald die Familienszene gut gemacht ist, habe ich das Gefühl, dass ich mit anderen Szenen problemlos zurechtkomme. Von den härtesten Knochen auszugehen, spiegelt nicht nur die technische Stärke von UniX AI wider, sondern stellt auch unseren strategischen Weg zum Markteintritt dar.
Yang Fengyu: UniX AI のモジュラー ハードウェア ソリューションは、あらゆるシナリオに対応できるわけではありません。同時に、認識と操作を分離してデータを最大限に活用する一連のモーション プリミティブ アルゴリズムを備えており、シーンへの移植性は非常に強力になります。どの製品にも限界はありますが、私たちはさまざまなシーンでの展開に挑戦していきたいと考えています。また、消費者を支援するためにいくつかの重要なビジネス シナリオも実行しています。 このサイト: いわゆるサプライチェーンのコストメリットとは何ですか? Yang Fengyu: 私たちのチームには、量産レベルのコスト管理手法を習得し、それをロボットのサプライ チェーンに適用できる、経験豊富なサプライ チェーン管理の専門家のグループがいます。ロボット業界ではまだ大規模な価格設定は行われていませんが、当社では当初から量産レベルでのコスト管理を行い、消費者に受け入れられる価格を実現しています。効果的なコスト管理により、当社の製品は価格競争力に優れ、企業の発展を強力にサポートできるものと確信しています。 このサイト: 今後発売される商品の価格帯はいくらですか? ヤン・フェンユー: 今これを公開するのは都合が悪いですが、 非常に驚くべき価格であることは保証します。 このサイト: 最後までどうやって行くつもりですか? Yang Fengyu: 最終的に向けたロジックは非常にシンプルです。 一定量の高品質な実際のデータが必要です。鍵はこのデータをどうやって取得するかにあります 例えば、テスラの自動運転を例にとると、車を道路上で継続的に走らせてデータを収集するのに6〜8年かかりました。 ロボット業界は、ロボットが自動的に何かを行うことを期待しています。まず、誰もが「便利」「楽しい」と感じて、消費能力の範囲内で誰もが購入したくなるようなワンポイントシーン機能をいくつか開発しました。 私たちのサプライチェーンには利点があり、価格を下げることができます。これは非常に重要なポイントです。 ユーザーからの継続的なフィードバックを通じて、製品の最適化と反復を続け、最終的には普遍的な身体化されたインテリジェントロボットを作成します。 ヤン・フェンユー: デモを作るのは実はとても簡単で、実験室で作ってしまえば成功です。量産の難しさは、1 台ではなく、100 台または 1000 台のユニットが実際にユーザーの家に入り、製品のデータ セキュリティ、動作の安定性、および基礎となる制御の信頼性をテストするという事実にあります。これには、強力なアフターセールス チームと継続的な体制が必要です。技術チーム。さらに、プロセスも非常に重要であり、量産能力をテストするための重要な指標でもあります。 もちろん、それがサプライチェーンの競争力を反映する一方で、テクノロジーの成熟度を示すことには疑いの余地はありません。初めてカニを食べた人は誰ですか?早く上手に食べる人は誰ですか?さらに、大量生産により一定の先行者利益が得られる可能性があります。 当サイト:起業を決めた後、最初に考えたチームビルディングの考え方と現在のチーム編成状況は? ヤン・フェンユー: 0-1から、先発チームは非常に重要です。私は、最初に最上位で物事を計画し、それを滝のように上から下にゆっくりと各レベルに展開することに慣れています。まず中核となるキーパーソンを見つけて取り組みを開始し、次に下方に拡張してチームを継続的に改善し、全体を回転させます。 昨年末から現在まで、私たちのチームは非常に急速に成長し、製品を 3 世代にわたって繰り返してきました。現在、チームの規模は具体化し始めていますが、今後もニーズに応じて調整と改善を続け、会社の競争力を高めていきます。 人材の獲得は、スタートアップ企業にとって最も重要なことの 1 つです。私は社内のほとんどの人材に個人的に会いました。 多くの場合、CEO は CEO であるだけでなく、私たちが行っていることの価値と重要性を同僚に説明する必要があります。 彼らに同意して一緒に道を歩ませることが非常に重要です。 同時に、この段階では、私の管理範囲は非常に大きく、管理の粒度も非常に細かくなります。非常に難しいですが、必要です。会社の方向性が正しく安定していることを包括的に把握し、確認して初めて、他の側面に多くの時間を費やすことができます。 このサイト: どうやってこれらの才能を引き付けるのですか? ヤン・フェンユー: 本質的に誰もが魅了されるのは、身体化された知性の終焉への道、そしてそれをどのように行うかという問題です。 私たちにはいくつかのハイライトがあります。まず、私たちのチームは強力な実行力と非常に速い反復速度を持っています。それは問題ありませんでしたが、数週間後に戻ってきたら、シーンはすでに完成しており、進捗は非常に速かったことがわかりました。また、国内のトップロボット企業からも積極的に参加を申し出てきた優秀な人材もいます。 このサイト: 外部からの資金調達計画はありますか? ヤン・フェンユー: 投資家からの現在のフィードバックは非常に好意的です。私たちは、普遍的な身体化されたインテリジェンスのビジョンを共有し、長期的に私たちと協力してくれる投資家を歓迎します。 このサイト: 今後の製品と将来の市場計画について詳しく教えていただけますか? ヤン・フェンユー: 私たちが量産しようとしているロボットはワンダと呼ばれるもので、車輪付きの人型双腕ロボットです。私たちがリリースした最初の技術ビデオでは、その機能の一部をご覧いただけますが、これがすべてではありません。9 月に消費者向けに発売する際には、さらに驚くべき詳細が発表される予定です。 最終的に、UniX AI が消費者に提供したいと考えている製品は、家族に役立つだけでなく、人々をより多くの場所に同行させ、より多くの機能を提供できる、普遍的な身体化されたインテリジェント ロボットです。技術的な開発も必要ですが、企業とユーザーとの協働共創も必要となります。小さな一歩を踏み出さなければ千マイルに到達することはできません。最初の一歩から始めましょう。
もっと見る Tao|Wang Changhu|Xia Lixue | Gao Jiyang|Demi Guo| 著者への連絡先: jjingl- (追加の際は名前、会社名、役職を明記してください) Das obige ist der detaillierte Inhalt vonNach 2000 CEO Yang Fengyu: Ein Arzt aus Yale kehrte nach China zurück, um ein Unternehmen zu gründen und baute innerhalb von fünf Monaten den ersten „massenproduzierten' humanoiden Roboter. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!