Le monde actuel de l’IA est gourmand en énergie et limité en termes de calcul. La trajectoire de développement des modèles est rapide, mais ces progrès nécessitent une augmentation substantielle de la puissance de calcul. L’informatique à transistors existante approche de ses limites physiques et a déjà du mal à répondre à ces demandes informatiques croissantes.
Les grandes entreprises ont tenté de résoudre ce problème en développant leurs propres solutions de puces personnalisées. Cependant, les goulots d'étranglement matériels peuvent être trop graves pour être surmontés avec des processeurs électroniques traditionnels. Alors, comment la technologie peut-elle répondre de manière adéquate à la croissance exponentielle de la demande de puissance de calcul ?
Dans les grands modèles de langage, plus de 90 % des tâches informatiques utilisent la multiplication matricielle. La multiplication matricielle peut prendre en charge divers modules fonctionnels de l'intelligence artificielle en effectuant les opérations de base de multiplication et d'addition de manière structurée. Cela s'applique non seulement aux modèles de langage, mais constitue également la base de presque tous les réseaux de neurones : il peut réaliser des connexions entre neurones à grande échelle, effectuer des opérations de convolution pour la classification d'images et la détection d'objets, traiter des données séquentielles, etc. Bien qu'il s'agisse d'un concept simple, il est essentiel pour manipuler et transformer efficacement les données qui prennent en charge l'IA et d'innombrables autres applications. L'importance de la multiplication matricielle ne peut donc pas être surestimée
À mesure que les modèles d'IA deviennent plus sophistiqués, plus ils sont grands, plus nous avons d'opérations matricielles. pour être performant, ce qui signifie que nous avons besoin d’une puissance de calcul plus puissante. Aujourd’hui encore, pour répondre à cette demande, les produits électroniques ont atteint leurs limites. Existe-t-il d'autres solutions ?
L'optique a été utilisée de nombreuses façons pour changer nos vies, notamment dans les communications optiques dans les réseaux de fibres optiques. L’informatique optique est une prochaine étape naturelle. L'électronique numérique nécessite un grand nombre de transistors pour effectuer les opérations arithmétiques les plus simples, tandis que l'informatique optique exploite les lois de la physique pour effectuer des calculs. Les informations d'entrée sont codées sous forme de faisceaux lumineux et des multiplications matricielles sont effectuées en utilisant les propriétés naturelles de l'optique telles que l'interférence et la diffraction. Les informations peuvent être codées dans plusieurs longueurs d'onde, polarisations et modes spatiaux, permettant ainsi à un nombre illimité de traitements et de calculs parallèles de se produire virtuellement à la vitesse de la lumière.
Avec la fin de Dennard Scaling et de la loi de Moore, il est temps de revisiter les bases de l'informatique. L'électronique numérique est intrinsèquement limitée aux configurations « 2D » : les grilles et les circuits des transistors sont fabriqués sur des tranches, et le calcul est effectué par le flux d'informations entre différentes unités sur le plan 2D. Cette architecture informatique 2D nécessite une densité de transistors toujours croissante, entraîne de sérieux problèmes d’interconnexion et souffre du fameux goulot d’étranglement de la mémoire. Avec le développement de la mémoire empilée 3D, la transformation de la conception 2D a désormais commencé, mais l'industrie dans son ensemble a encore un long chemin à parcourir pour s'adapter.
L'optique peut désormais révolutionner le jeu en effectuant des calculs naturellement dans l'espace 3D. L’ajout de nouvelles dimensions peut atténuer bon nombre des limitations de l’informatique traditionnelle. L'interconnexion des composants est plus facile et plus économe en énergie, et permet un débit toujours croissant (combien de calculs peuvent être effectués dans un temps donné) sans compromettre la latence (la rapidité avec laquelle chaque calcul est effectué). C'est tout à fait unique en optique 3D : que vous multipliiez 10 nombres ou 10 000 nombres, tout se passe simultanément à la vitesse de la lumière. Cela a un impact énorme sur l’évolutivité des processeurs optiques, leur permettant d’atteindre 1 000 fois la vitesse des processeurs numériques actuels.
En plus de l'évolutivité inhérente à l'optique 3D, les vitesses d'horloge de l'optique peuvent offrir des vitesses jusqu'à 100 fois plus rapides que celles de l'électronique traditionnelle, et la capacité de multiplexer les longueurs d'onde ouvre la porte à de nouvelles améliorations jusqu'à 100 fois. La combinaison de tout cela permet d'augmenter de manière exponentielle les vitesses de calcul avec un débit plus élevé, une latence plus faible et une fiabilité plus élevée que seule la multiplication matricielle optique 3D peut fournir. d'application. Le débit élevé et la faible latence apportés par l’optique 3D sont particulièrement précieux pour les tâches d’inférence d’intelligence artificielle dans les centres de données, une application axée sur la réactivité et l’efficacité en temps réel.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!