Les entreprises technologiques sont vraiment enthousiasmées par l’intelligence artificielle, souvent au point de créer des services et des fonctionnalités inutiles liés à l’IA, juste pour prouver qu’elles font quelque chose avec la technologie. Derrière un marketing insipide et des fonctionnalités inutiles se cachent des fonctionnalités d’IA véritablement impressionnantes qui feront la différence dans votre vie de tous les jours.
Qualcomm m'a invité cette semaine à son siège social à San Diego, en Californie, pour montrer ses travaux en cours sur la technologie de l'IA. Vous n'avez peut-être pas entendu parler de Qualcomm, mais c'est la société qui construit les chipsets de base pour d'innombrables téléphones et tablettes, des appareils haut de gamme comme le Galaxy S24 Ultra aux modèles économiques comme le Moto G 5G. Les modems de la société se trouvent dans la plupart des iPhones et fabriquent du matériel VR et AR destiné à être utilisé dans le Meta Quest et d’autres casques. Plus récemment, Qualcomm a commencé à créer des systèmes sur puce (SoC) haut de gamme pour les ordinateurs portables Windows, en concurrence directe avec les processeurs Intel et AMD.
Qualcomm développe un lot de matériel et de logiciels d'IA, construits à partir de l'expérience de l'entreprise en matière de traitement d'images mobiles et d'autres implémentations antérieures d'apprentissage automatique sur appareil. Les nouveaux chipsets Snapdragon X pour ordinateurs portables disposent d'une unité de traitement neuronal (NPU) dédiée pour les tâches d'IA sur l'appareil. Les puces mobiles les plus récentes de la société, comme le Snapdragon 8s Gen 3, peuvent gérer certains grands modèles de langage (LLM) sans l'aide d'un serveur externe via une connexion Internet. Qualcomm n'est pas seul ici, pour être clair : les derniers processeurs d'ordinateurs portables d'AMD et d'Intel disposent également de NPU, et les GPU Nvidia grand public peuvent également gérer de nombreuses charges de travail d'IA sur l'appareil.
Je sais ce que tu penses. Vous en avez assez d’entendre toutes les entreprises technologiques parler de l’IA comme si c’était la solution magique à tous les problèmes du monde. Vous en avez assez des fonctionnalités d’IA qui apparaissent dans vos applications préférées. Peut-être êtes-vous un artiste, un écrivain ou un autre créateur qui a entendu le directeur technique d'OpenAI dire que l'IA pourrait tuer certains emplois créatifs qui « n'auraient pas dû exister en premier lieu », et vous êtes prêt à tout brûler pour le sol. Je comprends cela, et je suis d’accord que la plupart des implémentations de « l’IA » à l’heure actuelle sont des solutions à la recherche d’un problème ou activement nuisibles.
Derrière le cycle absurde du battage médiatique sur l'IA et les dirigeants enthousiastes à l'idée de remplacer d'innombrables travailleurs par une automatisation moins chère, il existe des fonctionnalités en fait utiles qui ne sont devenues réalisables qu'avec du matériel récent de Qualcomm, Intel, AMD, NVIDIA et d'autres sociétés.
Cephable, une entreprise qui crée un outil de saisie basé sur une caméra pour les personnes handicapées, a présenté une version mise à jour de son logiciel fonctionnant sur un ordinateur portable Snapdragon X Elite. Il utilise une webcam pour surveiller les mouvements de la tête et les expressions faciales, les traduisant en pressions sur des touches ou en d'autres actions pour un logiciel de bureau (par exemple, tourner la tête pour changer de diapositive dans une présentation PowerPoint). La nouvelle version pour les ordinateurs portables Snapdragon exécute tous les logiciels d'apprentissage automatique sur le NPU dédié, réduisant ainsi l'utilisation de la batterie, améliorant la vitesse et la précision du traitement et libérant des ressources CPU et GPU pour vos autres applications. Il y a eu une autre démonstration de Djay Pro capable de diviser les chansons en plusieurs pistes instrumentales et vocales pour un mixage DJ en temps réel, ce qui n'est pratique qu'avec l'IA sur l'appareil. La dernière mise à jour de Logic Pro sur Mac et iPad offre des fonctionnalités similaires pour la production audio.
La possibilité d'exécuter de grands modèles de langage sur un smartphone, une tablette ou un PC plus classique ouvre d'autres cas d'utilisation intéressants. Par exemple, le prochain « Apple Intelligence » sur iPhone, iPad et Mac utilisera l’IA intégrée à l’appareil pour trier les notifications et mieux comprendre la langue parlée dans Siri. Certaines fonctionnalités sont plus difficiles à créer et à faire évoluer lorsqu’elles nécessitent un centre de données puissant quelque part, et c’est ce que les fabricants de matériel tentent de changer actuellement.
Il n’existe actuellement pas beaucoup d’applications et de services qui utilisent l’IA sur appareil, car ils peuvent se comporter différemment selon les appareils et les systèmes d’exploitation, et tout le monde ne dispose pas d’un téléphone ou d’un PC doté de la puissance de traitement requise. Des outils de développement plus récents, tels que TensorRT-LLM de NVIDIA et AI Engine Direct SDK de Qualcomm, rendent progressivement cette partie plus accessible aux développeurs de logiciels. À terme, l’ajout d’une fonctionnalité nécessitant un LLM puissant ne sera pas beaucoup plus complexe que l’ajout d’une fonctionnalité nécessitant n’importe quelle autre fonction système, et j’espère que c’est à ce moment-là que nous verrons davantage d’applications ajouter des fonctionnalités utiles.
Diese Fortschritte weisen auf eine Zukunft hin, in der mehr KI-Funktionen auf dem Gerät möglich sein werden und diese wie jede andere Funktionalität in Ihren Lieblingsanwendungen implementiert werden. Der Trend zu anstößigen KI-Chatbots oder KI-vorgeschlagenen Antworten auf Social-Media-Beiträge wird (hoffentlich) irgendwann verschwinden, aber wir bleiben bei den Funktionen, die „eigentlich nützlich“ sind. Das ist die wahre KI-Revolution: Keine riesige Copilot-Schaltfläche in Microsoft Edge, sondern Ihre Apps und Geräte werden intelligenter und erledigen bestimmte Aufgaben viel schneller und effizienter. Was alt ist, ist neu
Der Begriff „KI“ wird auch häufig verwendet, um dieselbe Funktionalität zu beschreiben, die vor einigen Jahren als „maschinelles Lernen“ bezeichnet wurde, wie z. B. die Objekterkennung in Fotos oder die Übersetzung von Texten zwischen Sprachen. Viele dieser Funktionen des maschinellen Lernens waren nützlich, wie zum Beispiel Google Fotos, das die Möglichkeit bietet, in Fotobibliotheken nach bestimmten Personen oder Haustieren zu suchen, oder die Verwendung von Google Lens, um herauszufinden, welche Art von Fehler Sie gerade gefunden haben. Viele dieser Funktionen waren noch nie so aufdringlich und aufdringlich wie viele moderne KI-Funktionen, und für viele dieser Funktionen sind keine großen, teuren Server erforderlich.
Die wahre KI-Revolution wird nicht aus lästigen Popups oder Chatbots überall oder hässlichen KI-generierten Bildern überall in den sozialen Medien bestehen. Es wird nur ein weiterer Schritt in der jahrzehntelangen Entwicklung der Software sein und Ihre Geräte nützlicher machen. Das ist die KI, die mich begeistert.
Offenlegung: Meine Reise nach San Diego, Kalifornien, um den AI Analyst & Media Workshop zu besuchen, wurde von Qualcomm bezahlt, einschließlich Reise und Unterkunft. Qualcomm hat diesen Artikel vor der Veröffentlichung nicht überprüft.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!