Les grands modèles de langage façonneront l’avenir de l’informatique, nécessitant des améliorations des charges de travail de l’IA.
Auteur : Luo Yiqi
Éditeurs : Luo Yifan Lu Taoran
Source photo : Visual China
Les terminaux mobiles apparaissent sous de plus en plus de formes et devraient disposer d'une plus grande puissance de calcul, ce qui impose davantage d'exigences aux capacités techniques de la puce sous-jacente.
Récemment, Arm a annoncé le lancement de la solution informatique totale 2023 (TCS23). Selon Chris Bergey, vice-président senior et directeur général de l'unité commerciale des terminaux d'Arm, « TCS23 inclut le nouveau GPU Arm Immortalis basé sur le nouveau GPU de cinquième génération. architecture, aidant Arm à faire face à la tendance à la baisse. De nouveaux clusters de processeurs Armv9 qui maintiennent le leadership en matière de performances dans l'intelligence artificielle (IA) de nouvelle génération, et de nouvelles améliorations qui rendent les logiciels plus accessibles à des millions de développeurs Arm.
Zou Ting, vice-président mondial d'Arm China Business, a déclaré dans son discours :Nous pouvons actuellement voir de plus en plus de technologies intelligentes, notamment l'IA générative, apparaître sur les appareils mobiles. Dans le même temps, la demande de performances supérieures, de plus d’intelligence et d’interactions visuelles et tactiles continue de monter en flèche. Cela entraîne également des exigences informatiques plus importantes et plus complexes qu’auparavant.
"L'utilisation des données mobiles continue d'augmenter. Le trafic mensuel moyen par utilisateur dans le monde devrait atteindre 19 Go. De nouvelles formes et de nouveaux éléments tels que les écrans flexibles et l'optique AR ont également commencé à attirer l'attention du public de différentes manières. L'IA générative et le mobile L'émergence de modèles linguistiques de bout en bout apportera de nouvelles capacités. Nous pensons que l'intérêt et la demande mondiale pour l'innovation dans les appareils mobiles continueront de s'accélérer », a-t-il poursuivi.Concernant la discussion du marché sur l'ajustement du modèle de tarification des licences, Arm a répondu au journaliste du 21st Century Business Herald : « Parce qu'Arm est dans une période de silence, nous ne pouvons pas commenter cela. En même temps, nous ne commentons pas les rumeurs ou les spéculations. .."
Efficacité encore améliorée
Zou Ting a présenté que la solution informatique complète Arm 2023 a été conçue en tenant compte des besoins des smartphones, couvrant le nouveau GPU phare Arm Immortalis et le nouveau cluster CPU Armv9.Plus précisément, les produits GPU lancés par Arm cette année adoptent l'architecture GPU de cinquième génération, qui redéfinit une partie du pipeline graphique pour optimiser la bande passante mémoire afin de prendre en charge les jeux de nouvelle génération et les applications 3D en temps réel avec une charge géométrique élevée sur les appareils mobiles, tout en apportant une expérience de jeu plus fluide comparable à celle des PC et des consoles de jeux.
Deferred Vertex Shading (DVS) est une fonctionnalité graphique nouvellement introduite dans l'architecture GPU de cinquième génération qui peut redéfinir le flux de données et aider les partenaires à augmenter le nombre de cœurs et à atteindre des niveaux de performances plus élevés.
Par rapport au produit de la génération précédente, les performances et l'efficacité énergétique du Arm Immortalis-G720 ont augmenté respectivement de 15 %, l'efficacité au niveau du système a augmenté de 40 % et la surface n'a augmenté que de 2 %.
Le cluster informatique Armv9 Cortex CPU a réalisé des améliorations de performances à deux chiffres pendant trois années consécutives, et son efficacité a également été considérablement améliorée.
En tant que cœur de quatrième génération, Arm Cortex-X4 présente une amélioration des performances de 15 % par rapport à la génération précédente Cortex-X3. La nouvelle microarchitecture économe en énergie basée sur le même processus peut réduire la consommation d'énergie de 40 % et augmenter la surface. seulement 10 %. Le processeur à gros cœur Cortex-A720 et le processeur à petit cœur Cortex-A520 améliorent tous deux l'efficacité énergétique de 20 % par rapport à leur génération précédente.
Zou Ting a déclaré qu'au début, Arm a écouté activement les commentaires des partenaires et a introduit un certain nombre de technologies innovantes dans TCS23, telles que la réduction de 25 % du retard causé par l'interconnexion et l'optimisation de la consommation d'énergie au repos, sans affecter la durée de vie de la batterie. il est toujours possible d'obtenir de bonnes performances du système.
En termes de scénarios d'application spécifiques, alors qu'Apple lancera des produits MR cette année, le développement de l'industrie de la réalité mixte a attiré beaucoup d'attention. Andy Craigen, directeur de la gestion des produits de la division Arm Terminal, a répondu au journaliste du 21st Century Business Herald :
« Les défis des produits MR se concentrent principalement sur le poids et la puissance du produit, notamment sous la forme de lunettes très légères. Immortalis-G720, récemment lancé, apportera suffisamment de puissance de traitement pour répondre aux exigences de performances graphiques requises par les produits MR. »
Nouvelle tendance de l'IA générative
Avec cette vague d'IA, les formes de performances et les exigences d'application des terminaux mobiles intelligents vont également changer.Concernant les tendances de développement ultérieures des terminaux mobiles, Chris Bergey a partagé : « Je pense que le plus évident est l'intérêt pour l'IA générative. Auparavant, la conférence Google I/O s'était concentrée sur l'introduction de l'IA générative dans l'écosystème Android ; les développeurs Microsoft Build La conférence a parlé de leur introduction dans Windows 11 pour améliorer encore l'expérience utilisateur, il est donc évident que l'IA générative et les grands modèles de langage sont définitivement un domaine émergent.
À cet égard,
Arm répond également activement pour garantir que l'IA puisse bien fonctionner sur l'architecture Arm. « Nous pensons que l'avenir sera un environnement plus hybride : le cloud computing continue de jouer un rôle important dans la création de grands modèles de langage ; mais étant donné que l'exécution locale sur un smartphone ou un autre appareil informatique peut améliorer la protection de la vie privée, l'efficacité énergétique et autres les problèmes sont également plus élevés, Les utilisateurs peuvent être plus disposés à exécuter des modèles plus petits sur l'appareil lui-même. » Il a ajouté que les grands modèles de langage façonneront l'avenir de l'informatique, ce qui signifie que les charges de travail de l'IA doivent être encore améliorées. , Arm a très de profondes réserves dans ce domaine, et les performances de l'IA ont été doublées sur la plateforme Arm. "Nous continuerons à faire progresser la prise en charge d'Arm NN et de la bibliothèque Arm Compute afin que les développeurs puissent continuer à exploiter des applications telles que Chat GPT ou de grands modèles de langage pour développer leurs applications." Actuellement, les terminaux électroniques automobiles deviennent un point de croissance à contre-tendance sur le marché à la baisse des semi-conducteurs. Concernant le marché dans ce domaine, Arm a déclaré aux journalistes : « Dans l'industrie actuelle des semi-conducteurs, les automobiles sont l'un des principaux moteurs de croissance. Nous constatons que ce marché est à un point d'inflexion critique, de la conception IP aux usines automobiles et autres approvisionnements complets. les chaînes sont réexaminées et redéfinies De nouveaux acteurs émergent pour rejoindre les rangs, tandis que les acteurs existants recherchent de nouvelles méthodes et idées pour rester compétitifs. L'écosystème cherche à résoudre les différentes charges de travail automobiles de manière sûre et efficace avec la gamme. de transformation requise, nous verrons l’innovation dans ce domaine continuer à se développer rapidement.
Recommandations précédentes
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!