Alors que le monde est toujours obsédé par les puces NVIDIA H100 et les achète follement pour répondre à la demande croissante de puissance de calcul de l'IA, lundi, heure locale, NVIDIA a discrètement lancé la dernière puce AI H200 pour la formation de grands modèles d'IA Par rapport à. Son produit H100 de génération précédente, les performances du H200 ont été améliorées d'environ 60% à 90%.
H200 est une version améliorée de NVIDIA H100. Il est également basé sur l'architecture Hopper comme le H100. La mise à niveau principale comprend 141 Go de mémoire vidéo HBM3e. La bande passante de la mémoire vidéo est passée de 3,35 To/s du H100 à 4,8 To/s. Selon le site officiel de NVIDIA, le H200 est également la première puce de la société à utiliser la mémoire HBM3e. Cette mémoire est plus rapide et a une plus grande capacité, elle est donc plus adaptée aux modèles à langages volumineux. NVIDIA a déclaré : « Avec le HBM3e, le NVIDIA H200 offre 141 Go de mémoire à 4,8 To par seconde, presque deux fois la capacité et 2,4 fois la bande passante par rapport à l'A100 . Selon les images officielles,
La vitesse de sortie du grand modèle Llama 2 et GPT-3.5 du H200 est respectivement 1,9 fois et 1,6 fois supérieure à celle du H100, et sa vitesse en calcul haute performance HPC a atteint 110 fois celle du dual-core Temps CPU x86. Le H200 devrait être livré au deuxième trimestre de l'année prochaine, et Nvidia n'a pas encore annoncé son prix.
Cependant, comme le H100 et d'autres puces IA, NVIDIA ne fournira pas de puces H200 aux fabricants chinois.
Le 17 octobre de cette année, le ministère américain du Commerce a publié de nouvelles réglementations de contrôle des exportations de puces, en particulier des contrôles plus stricts sur les puces d'IA à haute puissance de calcul. L'une des nouvelles réglementations très importantes consiste à ajuster les normes restreintes pour les puces informatiques avancées et à fixer un nouveau « seuil de densité de performances » comme paramètre. Selon la nouvelle réglementation, les « éditions spéciales » H800 et A800 de Nvidia Chine ne peuvent plus être exportées vers la Chine.
Le manque de puces d'IA les plus avancées posera certains défis au développement de l'industrie nationale de l'IA à court terme, mais il recèle également des opportunités :Premièrement, il existe
opportunités de remplacement des puces de puissance de calcul nationales, comme la récente commande de Baidu de 1 600 puces Huawei Ascend 910B. Deuxièmement, en raison de l'inadéquation entre l'offre et la demande, la hausse du prix de location de la puissance de calcul profitera à la location de puissance de calcul ; entreprises. Le 14, Huina Technology a annoncé que les frais de service de puissance de calcul pour les serveurs de calcul haute performance équipés de puces NVIDIA A100 seront augmentés de 100 %. Enfin, la technologie de packaging avancée représentée par Chiplet peut, dans une certaine mesure, résoudre le problème ; la pénurie de problèmes de capacité de production de processus avancés devrait ouvrir la voie à un développement accéléré. Donc, à part Huawei Shengteng, qui d'autre disposant d'une puissance informatique nationale peut porter la bannière ? Quelles sont les entreprises liées à la chaîne industrielle ? Quelles autres orientations devraient en bénéficier indirectement ?
Nos quatre principales directions de bénéfices et sociétés représentatives du contrôle indépendant de la puissance de calcul de l'IA nationaleont produit un sujet spécial "Il est impératif de contrôler indépendamment la puissance de calcul de l'IA". Les amis dans le besoin sont invités à scanner le code QR ci-dessous ou. Ajoutez l'assistant WeChat : hzkyxjyy, obtenez-le gratuitement ou lisez-le dans votre cercle d'amis. Après un ajout réussi, tous les rapports passés et chaque futur rapport spécial peuvent être lus gratuitement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!