IT Home News le 31 août Google Cloud a annoncé lors de la conférence Cloud Next qui s'est tenue aujourd'hui que les instances de machines virtuelles A3 seraient lancées le mois prochain. Google Cloud a annoncé l'instance A3 lors de la conférence des développeurs I/O en mai de cette année. Le plus grand point fort est qu'elle est équipée du GPU NVIDIA H100 Tensor Core pour répondre aux besoins de l'IA générative et des grands modèles de langage.
IT House a précédemment signalé que l'instance A3 utilise le processeur Intel Xeon Scalable de 4e génération, 2 To de mémoire DDR5-4800 et 8 GPU NVIDIA H100 "Hopper", atteignant 3,6 To/s via NVLink 4.0 et le partage de bande passante
.Le nouveau supercalculateur A3 est spécialement conçu pour former et exécuter les tâches les plus exigeantes sur les modèles d'IA qui sont à l'origine des innovations actuelles en matière d'IA générative et de modèles de langage à grande échelle. Selon les rapports, ce supercalculateur peut fournir 26 exaFlops de performances d'intelligence artificielle
Lors du lancement d'aujourd'hui, Google Cloud a également présenté le nouveau TPU v5e, qui est le cloud TPU le plus rentable et le plus accessible à ce jour. Ces TPU et ASIC personnalisés sont conçus pour accélérer les charges de travail d'intelligence artificielle et d'apprentissage automatique
Selon les rapports SDxCentral, TPU v5e a doublé les performances de formation par dollar et amélioré 2,5 fois les performances d'inférence par dollar par rapport aux produits de la génération précédente
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!