Tesla a déclaré lors d'une conférence d'investisseurs la semaine dernière que ses capacités de conduite autonome seraient considérablement améliorées une fois que le supercalculateur Dojo rejoindrait son infrastructure de calcul haute performance.
S'exprimant lors de la conférence de la Journée des investisseurs, Ashok Elluswamy, directeur du logiciel Tesla Autopilot, a déclaré que les véhicules Tesla (actuellement environ 400 000 clients) exécutant le logiciel FSD (Full Self-Driving) seront en mesure de prendre des décisions de conduite autonome plus intelligentes grâce à des mises à niveau matérielles, qui amélioreront les capacités globales de l’intelligence artificielle (IA).
L'entreprise dispose actuellement d'un système d'intelligence artificielle qui collecte des données visuelles de huit caméras sur la voiture en temps réel et génère une sortie 3D qui identifie les obstacles et leur mouvement, les véhicules, les routes et les feux de circulation, et prend des décisions pour aider le voiture Les tâches de prise de décision sont modélisées.
Tesla exploite son réseau automobile pour obtenir davantage de données visuelles et les intègre au modèle de formation. Les modèles de formation permettant d’apprendre continuellement à résoudre de nouveaux problèmes aident l’IA à mieux comprendre les tendances sur la route. Grâce aux mises à niveau du logiciel FSD, de nouvelles connaissances sont introduites dans la voiture.
"Si nous exécutons et répétons ce processus, cela s'améliore de plus en plus." Elluswamy a déclaré : "La solution pour un FSD évolutif consiste à obtenir une architecture, des données et un calcul parfaits, et nous avons constitué une équipe de classe mondiale. pour effectuer ce travail. Ils mettent ces trois efforts au premier plan. La société a fourni un correctif logiciel via une mise à jour en direct. Les clients Tesla peuvent acheter du FSD à partir de 99 $ par mois. Certains clients possédant des modèles Tesla plus anciens doivent également payer un supplément pour installer des ordinateurs FSD. Elluswamy affirme que les Teslas avec FSD sont toujours cinq à six fois plus sûres que la moyenne nationale américaine.
Elluswamy a déclaré : « À mesure que nous améliorons la sécurité, la fiabilité et le confort de nos systèmes, ils peuvent débloquer des opérations sans conducteur qui feront évoluer la façon dont les voitures sont utilisées et au-delà de la façon dont elles sont actuellement utilisées
Aujourd'hui, le La société exécute ses systèmes d'IA sur 14 000 GPU dans ses centres de données et peut exploiter 30 pétaoctets de cache vidéo, qui passe désormais à 200 pétaoctets. Environ 4 000 GPU sont utilisés pour l’étiquetage automatique, et les 10 000 GPU restants sont utilisés pour la formation des données d’intelligence artificielle.
Elluswamy a déclaré : "Une fois que nous aurons introduit Dojo (notre ordinateur d'entraînement) dans cette zone, tout cela augmentera considérablement."
Le système Dojo est basé sur la puce D1 auto-développée par Tesla et peut fournir 22,6 téraflops. des performances du FP32. Il dispose de 50 milliards de transistors et de 10 To/s de bande passante sur puce, ainsi que de 4 To/s de bande passante hors puce.
Un ensemble de puces D1 sera installé dans une armoire ExaPOD haute densité, qui fournira 1,1 exaoctets de performances BFP16 et CFP8. L’ordinateur FSB embarqué de Tesla peut fournir 150 téraflops de performances et est principalement utilisé pour l’inférence.
Ganesh Venkataraman, directeur principal du matériel chez Tesla, a déclaré lors d'un discours lors de la conférence Hot Chips de l'année dernière que Tesla avait fabriqué la puce D1 en raison de défauts de mise à l'échelle du GPU et du CPU.
Venkataraman a déclaré : "Nous avons remarqué beaucoup de goulots d'étranglement. D'abord du côté de l'inférence, c'est pourquoi nous utilisons des ordinateurs FSD. Ensuite, nous avons commencé à remarquer des problèmes similaires d'échelle de formation, et après avoir compris la charge de travail... nous pouvons, en fonction de le résultat Il faut optimiser notre système. »
Au début, le système d’IA de Tesla reposait sur des caméras uniques et des images vidéo uniques, qui étaient ensuite assemblées en post-traitement dans le système de planification de voiture autonome.
"C'était très fragile et n'a pas conduit à un succès significatif", a déclaré Elluswamy.
Au cours des dernières années, Tesla s'est transformée en un « monde vidéo multi-caméras ». Chaque véhicule dispose de huit caméras qui transmettent des informations visuelles au système d'IA, qui génère ensuite un espace de sortie 3D. L'IA prend des décisions sur la présence d'obstacles, leur déplacement, les voies, les routes et les feux de circulation, etc.
La modélisation des tâches va au-delà de la vision par ordinateur et utilise des techniques utilisées dans les systèmes d'intelligence artificielle tels que ChatGPT, notamment la modélisation autorégressive des Transformers, des modules d'attention et des jetons.
Elluswamy a déclaré : « Avec une telle solution de bout en bout pour la perception, nous supprimons réellement l'étape fragile de post-traitement et fournissons un résultat de haute qualité au système de planification. Même le système de planification n'est pas gravé dans le marbre. De plus en plus de systèmes d'intelligence artificielle commencent désormais à être utilisés pour résoudre ce problème. "
Les véhicules autonomes doivent réagir rapidement pour prendre des décisions fluides et sûres en temps réel. Elluswamy a donné l'exemple d'un temps de réponse de 50 millisecondes, où une voiture autonome peut prendre des décisions de conduite après avoir interagi avec l'environnement (y compris les piétons et les feux de circulation).
Cela fait beaucoup de données, et dans l’informatique traditionnelle, « chaque élément de données nécessite 10 millisecondes de temps de calcul, qui peut facilement dépasser 1 000 millisecondes, a déclaré Elluswamy : « Mais avec l’IA, nous avons emballé. » tout cela en 50 millisecondes de calcul afin qu'il puisse fonctionner en temps réel. . Tesla utilise des algorithmes pour reconstruire les voies, les limites des routes, les bordures, les passages pour piétons et d'autres images, qui servent ensuite de base pour aider la voiture à naviguer.
Elluswamy a déclaré : "Ceci est réalisé en collectant divers fragments de différentes voitures de la flotte et en combinant tous les fragments dans une représentation unifiée du monde autour de la voiture." système, le modèle de formation est constamment reconstruit. Pour entraîner les réseaux, Tesla a construit un pipeline d'étiquetage automatisé complexe sur les données collectées, y a exécuté des algorithmes informatiques, puis a généré des étiquettes pour entraîner ces réseaux.
Elluswamy a déclaré : "Une fois la reconstruction des fondations terminée, nous pouvons construire diverses simulations au-dessus de la fondation pour générer des données infiniment diverses pour la formation." Tesla dispose d'un simulateur puissant qui peut synthétiser les conditions météorologiques, les conditions d'éclairage et même les conditions météorologiques adverses. le mouvement d'autres objets. "Chaque fois que nous ajoutons des données, les performances s'améliorent."
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!