


Karpathy, ancien directeur de l'IA de Tesla, révèle son départ et sa solution de vision pure
Andrej Karpathy, ancien directeur de l'intelligence artificielle de Tesla et nouveau professeur de célébrités sur Internet en IA, a récemment participé au podcast de l'expert en intelligence artificielle du MIT, Lex Fridman. Pour les passionnés d’intelligence artificielle, cette interview peut être qualifiée d’« extase du double chef ».
Au cours de l'interview de près de trois heures et demie, les deux hommes ont parlé de grands sujets tels que l'intelligence artificielle, l'univers et la société humaine. Ils ont également discuté en détail de nombreuses technologies de Tesla, telles que la conduite autonome et les robots humanoïdes Optimus. , et spécial... SLA Vision Solutions. En outre, les deux ont également parlé de la démission d'Andrej, qui préoccupe le plus le public, et de la raison pour laquelle Tesla a annulé le radar à ultrasons.
Pas besoin de radar : cher mais difficile à utiliser !
Tesla a supprimé le radar à ondes millimétriques de la suite de capteurs l'année dernière et vient d'annoncer qu'elle supprimerait tous les radars à ultrasons, ne conservant que les caméras, et adopterait une solution purement visuelle. Lex a demandé : « Est-ce que cela rend la détection routière du véhicule plus difficile ou plus facile ? »
Karpathy a déclaré : « Les gens considèrent souvent ces capteurs comme un atout intégral de la voiture, mais si l'ensemble du produit est pleinement pris en compte, le sexe, ces capteurs sont en fait un fardeau potentiel. "
"Ces capteurs ne sont pas gratuits et ne peuvent pas apparaître de nulle part dans la voiture. Non seulement il faut une chaîne d'approvisionnement complète, mais il faut aussi que quelqu'un en soit responsable. l'approvisionnement", et ceux-ci coûtent de l'argent réel.
Dans le même temps, le capteur peut mal fonctionner et doit être remplacé. "Dans le cadre de la construction automobile, la production de capteurs peut également freiner le progrès global. Vous avez donc non seulement besoin d'approvisionnement et de maintenance, mais aussi d'une équipe pour écrire le firmware
Pas seulement cela, l'utilisation du radar." Les capteurs entraîneront également une défaillance du système de détection. Karpathy a déclaré : « Leur intégration dans le système de la voiture entraînera une expansion excessive de l'ensemble du système. »
L'installation d'autant de capteurs exercera également une pression sur le moteur de données. À mesure que les développements se poursuivent au fil du temps, les fonctions des capteurs deviennent de plus en plus raffinées. "Il y a trop de radars maintenant, chacun avec des fonctions différentes. Cela a provoqué une expansion excessive du système de détection. De plus, trop de radars vont interférer les uns avec les autres et affecter l'effet
Il a hautement félicité son ancien patron Musk." capacité à simplifier le complexe, « Je pense qu'Elon est très doué pour simplifier. Il a dit un jour : « Les meilleures parties ne sont pas des parties. » Il essaie toujours d'écarter les choses sans importance et fait toujours des soustractions, car il comprend le phénomène d'organisation. augmentation de l'entropie. "
Le coût est élevé, il y a de nombreux problèmes et les gens doivent constamment le réparer. Cela apportera également de la complexité au système de détection. Dans ce cas, le coût d’installation du radar est élevé et le potentiel de développement est faible.
"En tant qu'ingénieur en vision par ordinateur, si vous souhaitez améliorer le réseau de détection de véhicules, vous examinerez si l'ajout de capteurs est utile et dans quelle mesure. Nous menons des expériences comparatives pour vraiment déterminer si le radar peut fournir un état des routes très utile. informations aux propriétaires de voitures. Mais les résultats montrent que la différence n'est pas énorme, ce qui signifie que le radar n'est pas utile. " Karpathy a non seulement expliqué pourquoi Tesla a abandonné cette technologie, mais a également affirmé que d'autres constructeurs automobiles feraient le même choix. "Semblable au lidar, je ne pense pas que le radar à ultrasons puisse fournir beaucoup d'informations supplémentaires. Je pense que d'autres entreprises qui utilisent encore le lidar abandonneront cette technologie
Solution purement visuelle : mieux vaut
Karpathy pour les solutions purement visuelles." grande promesse. "Si nous choisissons une solution de vision pure, nous pouvons mutualiser toutes nos ressources et construire un moteur de données puissant.""La bande passante de ce capteur est très élevée, et nous avons fait des progrès substantiels dans ce domaine. A condition de le faire. si nous investissons massivement dans cette technologie, nous pouvons réaliser des réalisations extraordinaires."
Karpathy a déclaré qu'une solution purement visuelle est à la fois nécessaire et suffisante. Dans un sens, le monde est conçu pour la consommation visuelle humaine, et les gens ont des besoins visuels.
En même temps, cette solution peut fournir toutes les informations de conduite dont tous les conducteurs ont besoin. "Nous devons donc concentrer nos ressources sur le développement de cette technologie et continuer à nous demander : 'Est-ce que je veux vraiment introduire d'autres capteurs ?' Je pense que la réponse dans ce cas est non
.Bien que la solution de vision pure ait reçu un fort soutien de Karpathy, lorsque Lex lui a demandé comment il considérait la différence entre les solutions lidar et de vision pure, ainsi que les nuages de points et les voxels, Karpathy a répondu franchement : Les deux ne sont pas au centre de la conduite automatisée. .
Il a déclaré : « Je n'ai jamais compris ce débat. Parce que ce n'est pas le cœur du problème. Je pense que tout le monde devrait faire attention à l'existence d'une flotte d'essais routiers comme support lorsqu'on parle d'automatisation. Le système de renseignement peut être meilleur. La clé du service. "
Par conséquent, il est nécessaire d'être exhaustif lorsque l'on considère les capacités de détection du capteur. Cela inclut s'il peut fournir une flotte d'essais routiers pour collecter de grandes quantités de données, s'il peut intégrer des capteurs et des données, et intégrer des capteurs dans le moteur de données pour permettre une recherche rapide de différentes parties des données, puis améliorer continuellement les modèles utilisés. .
Carte au niveau du centimètre : Pas besoin !
Quand on lui a demandé ce qu'il pensait des autres entreprises produisant des cartes haute définition des voitures autonomes dans leurs zones d'exploitation, Karpathy a répondu : "C'est fou !" changer le monde, en parler à l'échelle mondiale Comment cette technologie peut-elle être appliquée au domaine des transports Si vous devez continuellement fournir une carte précise au centimètre près du monde ou d'une ville et la maintenir à jour, le coût est trop élevé ? " Lorsque Lex a demandé si cette approche serait étendue aux États-Unis. En examinant toutes les régions du pays, Karpathy a utilisé l'exemple de Tesla pour expliquer : " Les gens n'ont pas besoin d'une carte d'une telle précision. Une carte précise suffit pour afficher des informations clés telles que les conditions routières et les sections de route à venir. Les conducteurs peuvent les utiliser tout comme Google Maps. Les informations clés sont de comprendre votre environnement "
" Tesla utilise des informations avec une résolution similaire. à Google Maps dans le système de conduite. Mais il ne pré-dessine pas de cartes avec une précision centimétrique. Cette approche est superflue et ingrate, elle dilue également les capacités de l'équipe et empêche les techniciens de se concentrer sur ce qui est vraiment nécessaire, à savoir l'ordinateur. problèmes de vision. "
Reviendrez-vous après votre départ ? C'est de l'amour
En parlant de la raison pour laquelle il a quitté Tesla, Karpathy a déclaré que c'était une décision difficile. Bien que Tesla n’ait pas encore pleinement mis en œuvre la conduite autonome, l’équipe R&D a pu se développer de manière autonome. Cette démission lui a également donné l'occasion de reconsidérer son amour pour l'intelligence artificielle, l'open source et l'éducation.Auparavant, il avait travaillé pour Tesla pendant 5 ans et relevait directement du grand patron Musk Parmi les dirigeants de Tesla, il est définitivement considéré comme un vétéran. Selon certaines informations, le disciple de Li Feifei était en congé depuis plusieurs mois. Il avait précédemment déclaré qu'il reviendrait chez Tesla après son congé dans un avenir proche, mais il a immédiatement annoncé sa démission.
Karpathy a déclaré : « Je suis très heureux d'aider Tesla à atteindre de nombreux objectifs au cours des cinq dernières années. La décision de partir est en fait un choix difficile. Au cours de ces cinq années, la conduite autonome a achevé sa « graduation » " En commençant par trébucher pour trouver un moyen, je conduis dans les rues de la ville. J'attends avec impatience l'avenir d'une équipe de conduite autonome plus puissante pour continuer à être brillant. " Concernant ses projets futurs après avoir quitté son emploi, a-t-il déclaré. : "Il n'y a rien dans le futur. Le plan spécifique pourrait être de revenir dans des domaines où il a une passion de longue date, comme le travail sur la technologie de l'IA, l'open source et l'éducation. "
Bien sûr, il a également mentionné la possibilité de son retour chez Tesla dans l'interview : "Peut-être quelque part. Je reviendrai un jour travailler sur Optimus ou AGI (Artificial General Intelligence) chez Tesla. Tesla sera une entreprise incroyable avec des designers talentueux dans cette immense entreprise de robotique. Nous créons une entreprise sans précédent. de nouvelles choses. Ce qu'il poursuit n'est pas le matériel et le statut, mais le progrès continu de la technologie. Ceci est similaire au comportement de son mentor Li Feifei, qui a refusé de changer de carrière après l'obtention de son diplôme et s'en est tenu à la recherche sur la reconnaissance d'images informatiques. C'est peut-être « comme un enseignant, comme un disciple » !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Intelligent App Control est un outil très utile dans Windows 11 qui aide à protéger votre PC contre les applications non autorisées qui peuvent endommager vos données, telles que les ransomwares ou les logiciels espions. Cet article explique ce qu'est Smart App Control, comment il fonctionne et comment l'activer ou le désactiver dans Windows 11. Qu’est-ce que Smart App Control dans Windows 11 ? Smart App Control (SAC) est une nouvelle fonctionnalité de sécurité introduite dans la mise à jour Windows 1122H2. Il fonctionne avec Microsoft Defender ou un logiciel antivirus tiers pour bloquer les applications potentiellement inutiles susceptibles de ralentir votre appareil, d'afficher des publicités inattendues ou d'effectuer d'autres actions inattendues. Application intelligente

Avec une capacité d'imitation de l'IA aussi puissante, il est vraiment impossible de l'empêcher. Le développement de l’IA a-t-il atteint ce niveau aujourd’hui ? Votre pied avant fait voler les traits de votre visage, et sur votre pied arrière, la même expression est reproduite. Regarder fixement, lever les sourcils, faire la moue, aussi exagérée que soit l'expression, tout est parfaitement imité. Augmentez la difficulté, haussez les sourcils, ouvrez plus grand les yeux, et même la forme de la bouche est tordue, et l'avatar du personnage virtuel peut parfaitement reproduire l'expression. Lorsque vous ajustez les paramètres à gauche, l'avatar virtuel à droite modifiera également ses mouvements en conséquence pour donner un gros plan de la bouche et des yeux. On ne peut pas dire que l'imitation soit exactement la même, seule l'expression est exactement la même. idem (extrême droite). La recherche provient d'institutions telles que l'Université technique de Munich, qui propose GaussianAvatars, qui

Un modèle volumineux capable d'analyser automatiquement le contenu des PDF, des pages Web, des affiches et des graphiques Excel n'est pas très pratique pour les travailleurs. Le modèle InternLM-XComposer2-4KHD (en abrégé IXC2-4KHD) proposé par Shanghai AILab, l'Université chinoise de Hong Kong et d'autres instituts de recherche en fait une réalité. Par rapport à d'autres grands modèles multimodaux qui ont une limite de résolution ne dépassant pas 1 500 x 1 500, ce travail augmente l'image d'entrée maximale des grands modèles multimodaux à une résolution supérieure à 4K (3 840 x 1 600) et prend en charge n'importe quel rapport d'aspect et 336 pixels en 4K. Changements de résolution dynamiques. Trois jours après sa sortie, le modèle était en tête de la liste de popularité des modèles de réponses visuelles aux questions HuggingFace. Facile à manier

Cet article est reproduit avec la permission du compte public Autonomous Driving Heart. Veuillez contacter la source pour la réimpression. Titre original : MotionLM : Multi-Agent Motion Forecasting as Language Modeling Lien vers l'article : https://arxiv.org/pdf/2309.16534.pdf Affiliation de l'auteur : Conférence Waymo : ICCV2023 Idée d'article : Pour la planification de la sécurité des véhicules autonomes, prédisez de manière fiable le comportement futur des agents routiers est cruciale. Cette étude représente les trajectoires continues sous forme de séquences de jetons de mouvement discrets et traite la prédiction de mouvement multi-agents comme une tâche de modélisation du langage. Le modèle que nous proposons, MotionLM, présente les avantages suivants :

Le magazine "ComputerWorld" a écrit un article disant que "la programmation disparaîtra d'ici 1960" parce qu'IBM a développé un nouveau langage FORTRAN, qui permet aux ingénieurs d'écrire les formules mathématiques dont ils ont besoin, puis de les soumettre à l'ordinateur pour que la programmation se termine. Picture Quelques années plus tard, nous avons entendu un nouveau dicton : tout homme d'affaires peut utiliser des termes commerciaux pour décrire ses problèmes et dire à l'ordinateur quoi faire. Grâce à ce langage de programmation appelé COBOL, les entreprises n'ont plus besoin de programmeurs. Plus tard, il est dit qu'IBM a développé un nouveau langage de programmation appelé RPG qui permet aux employés de remplir des formulaires et de générer des rapports, de sorte que la plupart des besoins de programmation de l'entreprise puissent être satisfaits grâce à lui.

Le robot humanoïde, qui mesure 1,65 mètre, pèse 55 kilogrammes et possède 44 degrés de liberté dans son corps, peut marcher rapidement, éviter les obstacles rapidement, monter et descendre régulièrement les pentes et résister aux chocs et aux interférences. Vous pouvez désormais le ramener chez vous. ! Le robot humanoïde universel GR-1 de Fourier Intelligence a commencé la prévente. Salle de conférence Robot Le robot humanoïde universel Fourier GR-1 de Fourier Intelligence est maintenant ouvert à la prévente. GR-1 a une configuration de tronc hautement bionique et un contrôle de mouvement anthropomorphique. Il a 44 degrés de liberté dans tout le corps. Il a la capacité de marcher, d'éviter les obstacles, de franchir des obstacles, de monter et de descendre des pentes, de résister aux interférences et de s'adapter. à différentes surfaces routières. C'est un système d'intelligence artificielle général. Page de prévente du site officiel : www.fftai.cn/order#FourierGR-1# Fourier Intelligence doit être réécrit.

Récemment, Huawei a annoncé qu'il lancerait en septembre un nouveau produit portable intelligent équipé du système de détection Xuanji, qui devrait être la dernière montre intelligente de Huawei. Ce nouveau produit intégrera des fonctions avancées de surveillance de la santé émotionnelle. Le système de perception Xuanji fournit aux utilisateurs une évaluation complète de la santé avec ses six caractéristiques : précision, exhaustivité, rapidité, flexibilité, ouverture et évolutivité. Le système utilise un module de super-détection et optimise la technologie d'architecture de chemin optique multicanal, ce qui améliore considérablement la précision de surveillance des indicateurs de base tels que la fréquence cardiaque, l'oxygène dans le sang et la fréquence respiratoire. En outre, le système de détection Xuanji a également élargi la recherche sur les états émotionnels sur la base des données de fréquence cardiaque. Il ne se limite pas aux indicateurs physiologiques, mais peut également évaluer l'état émotionnel et le niveau de stress de l'utilisateur. Il prend en charge la surveillance de plus de 60 sports. indicateurs de santé, couvrant les domaines cardiovasculaire, respiratoire, neurologique, endocrinien,

Titre original : TowardsRealisticSceneGenerationwithLiDARDiffusionModels Lien vers l'article : https://hancyran.github.io/assets/paper/lidar_diffusion.pdf Lien vers le code : https://lidar-diffusion.github.io Affiliation de l'auteur : CMU Toyota Research Institute University of Southern California Article idées : Les modèles de diffusion (DM) excellent dans la synthèse d'images photoréalistes, mais les adapter à la génération de scènes lidar présente des défis importants. Ceci est principalement dû au fait que les DM opérant dans l'espace de points ont des difficultés
