Heim > Technologie-Peripheriegeräte > KI > Der entscheidende Schritt zum „Einsteigen ins Auto' für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da

Der entscheidende Schritt zum „Einsteigen ins Auto' für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da

PHPz
Freigeben: 2023-09-16 20:13:02
nach vorne
1326 Leute haben es durchsucht

DriveLM ist ein sprachbasiertes Treiberprojekt, das einen Datensatz und ein Modell enthält. Mit DriveLM führen wir die Inferenzfähigkeiten großer Sprachmodelle im autonomen Fahren (AD) ein, um Entscheidungen zu treffen und eine erklärbare Planung sicherzustellen.

Im Datensatz von DriveLM verwenden wir von Menschen geschriebene Argumentationslogik als Verbindungen, um Wahrnehmung, Vorhersage und Planung zu erleichtern (P3). In unserem Modell schlagen wir ein visuelles AD-Sprachmodell mit Mindmapping-Funktionen vor, um bessere Planungsergebnisse zu erzielen. Derzeit haben wir eine Demoversion des Datensatzes veröffentlicht, und der vollständige Datensatz und das Modell werden in Zukunft veröffentlicht

Projektlink: https://github.com/OpenDriveLab/DriveLM Was neu geschrieben werden muss, ist: Projektlink: https://github.com/OpenDriveLab/DriveLM

Der entscheidende Schritt zum „Einsteigen ins Auto für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da

Der entscheidende Schritt zum „Einsteigen ins Auto für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da

Was ist Graph-of-Thoughts in AD?

Der aufregendste Aspekt des Datensatzes ist: Die Frage-Antwort-Funktion (QA) in P3 ist in einer grafischen Struktur mit QA-Paaren als jedem Knoten und den Beziehungen von Objekten als Kanten verbunden.

Im Vergleich zu rein sprachlichen Denkbäumen oder Denkkarten bevorzugen wir Multimodalität. Im AD-Bereich tun wir dies, weil jede Stufe die AD-Aufgabe definiert, von der Rohsensoreingabe bis zur endgültigen Steuerungsaktion

Der entscheidende Schritt zum „Einsteigen ins Auto für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da

Der entscheidende Schritt zum „Einsteigen ins Auto für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da

Was ist im DriveLM-Datensatz enthalten?

Erstellen Sie unseren Datensatz basierend auf dem gängigen nuScenes-Datensatz. Das Kernelement von DriveLM ist die rahmenbasierte P3-Qualitätssicherung. Wahrnehmungsprobleme erfordern, dass Modelle Objekte in einer Szene erkennen. Das Vorhersageproblem erfordert, dass das Modell den zukünftigen Zustand wichtiger Objekte in der Szene vorhersagt. Planungsprobleme veranlassen das Modell, sinnvolle Planungsmaßnahmen zu ergreifen und gefährliche Maßnahmen zu vermeiden.

Wie läuft der Kalibrierungsprozess ab?

  1. Keyframe-Auswahl. Ausgehend von allen Frames in einem Clip wählt der Annotator die Keyframes aus, die mit Anmerkungen versehen werden müssen. Der Standard besagt, dass diese Rahmenwerke Änderungen im Bewegungszustand des eigenen Fahrzeugs beinhalten sollten (Spurwechsel, plötzliches Anhalten, Anfahren nach dem Anhalten usw.).
  2. Schlüsselobjektauswahl. Bei einem gegebenen Keyframe muss der Annotator Schlüsselobjekte in sechs umgebenden Bildern erfassen. Der Standard besagt, dass diese Objekte das eigene Fahrzeug beeinflussen können (Ampeln, Fußgänger, die die Straße überqueren, andere Fahrzeuge)
  3. Q&A-Hinweise. Anhand dieser Schlüsselobjekte generieren wir automatisch Fragen zu einzelnen oder mehreren Objekten zu Wahrnehmung, Vorhersage und Planung. Weitere Details finden Sie in unseren Demodaten.

Das obige ist der detaillierte Inhalt vonDer entscheidende Schritt zum „Einsteigen ins Auto' für große Modelle: Der weltweit erste Open-Source-Datensatz für Sprache und autonomes Fahren ist da. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage