L3 wird spätestens in der ersten Hälfte des nächsten Jahres auf den Markt kommen: ideales durchgängiges autonomes Fahren und stark verbesserte Leistung-KI-php.cn

L3 wird spätestens in der ersten Hälfte des nächsten Jahres auf den Markt kommen: ideales durchgängiges autonomes Fahren und stark verbesserte Leistung

PHPz

Freigeben： 2024-08-07 04:35:32

Original

674 Leute haben es durchsucht

Mit dem Aufkommen der generativen KI-Technologie erforschen viele neue Kräfte im Automobilbau neue Methoden für visuelle Sprachmodelle und Weltmodelle. Neue Technologien scheinen zu einer gemeinsamen Forschungsrichtung geworden zu sein. Letzten Monat veröffentlichte Li Auto die End-to-End-Architektur für autonomes Fahren der dritten Generation + visuelles VLM-Sprachmodell + Weltmodell. Diese Architektur wurde Tausenden von Menschen für interne Tests zur Verfügung gestellt. Sie verkörpert intelligentes Fahrverhalten, verbessert die Informationsverarbeitungseffizienz der KI und verbessert die Fähigkeit, komplexe Straßenbedingungen zu verstehen und darauf zu reagieren. Li Xiang sagte einmal in einer öffentlichen Mitteilung, dass VLM (Visual Language Model) angesichts seltener Fahrumgebungen, die für die meisten Algorithmen schwer zu erkennen und zu verarbeiten sind, theoretisch einen Durchbruch erzielen kann .

L3 wird spätestens in der ersten Hälfte des nächsten Jahres auf den Markt kommen: ideales durchgängiges autonomes Fahren und stark verbesserte Leistung

Die neue Generation autonomer Fahrsysteme hat die Obergrenze der Fähigkeiten erheblich erhöht – so kann die KI viele Situationen bewältigen, die in der Vergangenheit schwer zu lösen waren. Außerdem wurde die Schwelle gesenkt – wodurch der Bedarf an technologischer Forschung und Entwicklung verringert wurde Teams, und es wird erwartet, dass es in naher Zukunft mehr Menschen das Fahren ermöglichen wird. Erhalten Sie in Zukunft ein erheblich verbessertes Erlebnis.
Dieser Satz autonomer Fahrtechnologiearchitektur ist von der schnellen und langsamen Systemtheorie des Nobelpreisträgers Daniel Kahneman inspiriert. Die Simulation menschlicher Denk- und Entscheidungsprozesse im Bereich des autonomen Fahrens erfordert auch die Zusammenarbeit von „schnellen Systemen“ und „langsamen Systemen“. . Darunter:
・ Das schnelle System (System 1) ist gut in der Bewältigung einfacher Aufgaben und basiert auf menschlicher Intuition, die auf Erfahrungen und Gewohnheiten beim autonomen Fahren basiert. Es besteht aus einem durchgängigen großen Modell, einschließlich Wahrnehmung und Planung , was ausreicht, um 95 % der Probleme beim Fahren eines Fahrzeugs zu bewältigen.
・ Das langsame System (System 2) ist das logische Denken, die komplexe Analyse und die Rechenfähigkeiten, die der Mensch durch tieferes Verständnis und Lernen im autonomen Fahrsystem entwickelt. Es ist hauptsächlich das VLM-Modell, das zur Lösung komplexer oder sogar unbekannter Probleme verwendet wird Probleme beim Führen eines Fahrzeugs Verkehrsszenen machen etwa 5 % der täglichen Fahrszenen aus.
Letzte Woche betonte Lang komplexe Straßenverhältnisse und Verkehrsregeln verstehen.
„Sowohl End-to-End- als auch traditionelle Wahrnehmungsentscheidungsmodelle erfordern eine große Datenmenge für das Training. Ein potenzielles Problem besteht darin, dass das System nicht gut funktioniert, wenn es auf unsichtbare Szenen stößt“, sagte Lang Xianpeng. „Wir erforschen die Fähigkeit von Fahrzeugen, wie Menschen zu denken und Entscheidungen zu treffen.“

L3 wird spätestens in der ersten Hälfte des nächsten Jahres auf den Markt kommen: ideales durchgängiges autonomes Fahren und stark verbesserte Leistung

Seit der zweiten Hälfte des letzten Jahres begann Ideal, seine Strategie anzupassen und seinen Kurs zu ändern. Im Februar dieses Jahres wandten Forscher in dem vom Cross-Information Research Institute der Tsinghua University und Li Auto eingereichten DriveVLM-Papier das visuelle Sprachmodell (VLM) an, das kürzlich im Bereich der generativen KI aufgetaucht ist und außergewöhnliche Fähigkeiten im visuellen Verständnis und Denken demonstrierte . In der Branche ist dies die erste Arbeit, die ein autonomes Fahrgeschwindigkeitssystem vorschlägt. Seine Methode kombiniert die Mainstream-Pipeline für autonomes Fahren und eine große Modellpipeline vollständig mit logischem Denken und ist die erste, die die große Modellarbeit des Endtests abschließt Bereitstellung (Basierend auf der NVIDIA Orin-Plattform).

DriveVLM-System

L3 wird spätestens in der ersten Hälfte des nächsten Jahres auf den Markt kommen: ideales durchgängiges autonomes Fahren und stark verbesserte Leistung

DriveVLM besteht aus einem Chain-of-Though (CoT)-Prozess mit drei Schlüsselmodulen: Szenariobeschreibung: Verwenden Sie Sprache, um die Fahrumgebung zu beschreiben und Schlüsselobjekte zu identifizieren.

Szenarioanalyse: Tauchen Sie ein in die Eigenschaften von Schlüsselobjekten und deren Auswirkungen auf das Ego-Fahrzeug.

Hierarchische Planung: Schrittweise Planentwicklung von Meta-Aktions- und Entscheidungsbeschreibungen bis hin zu Wegpunkten.
Diese Module entsprechen den Wahrnehmungs-, Vorhersage- und Planungskomponenten im traditionellen autonomen Fahrsystemprozess. Der Unterschied liegt in ihrer Fähigkeit, die Objektwahrnehmung, die Vorhersage auf Absichtsebene und die Planung auf Aufgabenebene zu bewältigen, die bisher äußerst herausfordernd waren Vergangenheit.

Technische Verifizierung

Die ideale Verifizierungstechnologie ist in Long-Tail-Szenarien wirksam:

Realumgebungsdaten zerlegen

Generative Modelle nutzen, um neue Perspektiven zu ergänzen

Änderungen an Wetter, Zeit, Verkehrsfluss und anderen Bedingungen anpassen
Praktische Anwendung

Das End-to-End-Modell und das VLM-Modell von Li Auto laufen in Echtzeit:

End-to-End-Modell: höhere Bildrate

VLM-Modell: größere Anzahl von Parametern, niedrigere Bildrate

In komplexen Städten spielt VLM in Situationen, in denen eine Entscheidungsfindung unmöglich ist, eine Rolle und liefert Entscheidungsergebnisse und -verläufe an das End-to-End-Modell.

End-to-End-Ansatz

Der End-to-End-Ansatz ist zu einem technologischen Wendepunkt geworden und markiert den Beginn des tatsächlichen Einsatzes von KI.

Das KI-Modell der neuen Generation

Das KI-Modell der neuen Generation kann als Fragesteller dienen:

Wählen Sie die Daten von Benutzern aus, die den Standard privater Autofahrer erfüllen, als „echte Fragen“

Kombiniert mit der Welt Modell zur Generierung von „Simulationsfragen“

Herausforderung der Rechenleistung

Der Einsatz von VLM und anderen Modellen auf der Automobilseite steht vor Herausforderungen bei der Rechenleistung:

Behalten Sie die optimale Anzahl von Parametern bei
Optimieren Sie die Technik, um die Entscheidungslatenz zu verbessern

Wettbewerbsaussichten

Tesla FSD steht kurz davor Betreten Sie den Bereich des inländischen intelligenten Fahrens. Eintritt in eine neue Wettbewerbsphase:

Ideales Autoziel: End-to-End + VLM-Autonomes Fahren in Massenproduktion

Das obige ist der detaillierte Inhalt vonL3 wird spätestens in der ersten Hälfte des nächsten Jahres auf den Markt kommen: ideales durchgängiges autonomes Fahren und stark verbesserte Leistung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!