Selon l'actualité du 31 août, Google Cloud a annoncé lors de la conférence Cloud Next qui s'est tenue aujourd'hui qu'il lancerait des instances de machine virtuelle A3 le mois prochain. Le plus gros point fort de cette nouvelle instance de machine virtuelle est qu'elle est équipée de NVIDIA H100 Le GPU Tensor Core peut répondre aux besoins de l'intelligence artificielle générative et des grands modèles de langage.
Selon les rapports, l'instance A3 utilise le processeur Intel Xeon Scalable de 4e génération, 2 To de mémoire DDR5-4800 et 8 GPU NVIDIA H100 "Hopper". Par NVlink 4.0 et NVSwitch, cette instance implémente 3.6 Bande passante de bissection en TBps. Le nouveau supercalculateur A3 est conçu pour former et servir les modèles d’IA les plus exigeants et alimenter l’IA générative et l’innovation des modèles de langage à grande échelle. On dit que ce supercalculateur peut fournir 26 Performances de l'intelligence artificielle d'exaFlops.
De plus, Google Cloud a également présenté le nouveau TPU v5e lors de la conférence de presse. Ce cloud TPU est le plus rentable et le plus accessible à ce jour. Ces TPU ou ASIC personnalisés visent à accélérer les charges de travail d’intelligence artificielle et d’apprentissage automatique. Selon SDxCentral, TPU v5e double les performances d'entraînement par dollar et améliore les performances d'inférence par dollar de 2,5 fois par rapport à la génération précédente
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!