


NVIDIA lance le H200, la puce IA la plus puissante au monde : des performances presque doublées par rapport au H100
NVIDIA lance la puce IA la plus puissante au monde, la H200 : des performances presque doublées par rapport à la H100
Quick Technology a rapporté aujourd'hui (14 novembre) que lors de la Global Supercomputing Conference 2023 (SC2023), le géant des puces Nvidia a publié le successeur de la puce H100, qui est actuellement la puce IA la plus puissante au monde, la H200.
Les performances du H200 sont directement améliorées de 60% à 90% par rapport au H100
De plus, le H200 et le H100 sont tous deux basés sur l'architecture NVIDIA Hopper, ce qui signifie également que les deux puces sont compatibles entre elles. Pour les entreprises utilisant le H100, elles peuvent être remplacées de manière transparente par le dernier H200.
H200 est la première puce de NVIDIA à utiliser la mémoire HBM3e. Elle a une vitesse plus rapide et une plus grande capacité, et est très adaptée à la formation et à l'inférence de grands modèles de langage
.En plus de la mémoire HBM3e, la capacité de mémoire du H200 est de 141 Go et la bande passante est passée de 3,35 To/s du H100 à 4,8 To/s.
L'amélioration des performances du H200 se reflète principalement dans les performances d'inférence des grands modèles. La vitesse d'inférence du H200 sur le grand modèle Llama2 avec 70 milliards de paramètres est deux fois plus rapide que celle du H100, et la consommation d'énergie d'inférence du H200 est directement réduite. de moitié par rapport au H100.
H200 a une bande passante mémoire plus élevée, ce qui signifie que pour les applications informatiques hautes performances gourmandes en mémoire, les données d'exploitation sont accessibles plus efficacement. L'utilisation du H200 peut améliorer le temps d'acquisition des résultats jusqu'à 110 fois par rapport à une unité centrale (CPU)
Nvidia a déclaré que le H200 devrait être expédié au deuxième trimestre 2024. Le prix n'a pas encore été annoncé. Cependant, en raison de la pénurie de puissance de calcul, les grandes entreprises technologiques devraient encore s'approvisionner.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Selon les informations de ce site Web du 23 février, NVIDIA a mis à jour et lancé hier soir l'application NVIDIA, offrant aux joueurs un nouveau centre de contrôle GPU unifié, permettant aux joueurs de capturer des moments merveilleux grâce au puissant outil d'enregistrement fourni par le flotteur du jeu. fenêtre. Dans cette mise à jour, NVIDIA a également introduit la fonction RTXHDR. L'introduction officielle est jointe à ce site : RTXHDR est un nouveau filtre Freestyle basé sur l'IA qui peut introduire de manière transparente les superbes effets visuels de la plage dynamique élevée (HDR) dans les jeux qui ne le font pas. prend en charge à l'origine le HDR. Tout ce dont vous avez besoin est un moniteur compatible HDR pour utiliser cette fonctionnalité avec une large gamme de jeux basés sur DirectX et Vulkan. Une fois que le lecteur a activé la fonction RTXHDR, le jeu fonctionnera même s'il ne prend pas en charge la HD.

Selon les informations de ce site Web du 19 février, dans la dernière vidéo de la chaîne LawisDead de Moore, le présentateur Tom a révélé que les cartes graphiques de la série Nvidia GeForce RTX50 seront nativement équipées d'une interface d'alimentation PCIeGen6 à 16 broches. Tom a déclaré qu'en plus des séries haut de gamme GeForceRTX5080 et GeForceRTX5090, le GeForceRTX5060 de milieu de gamme permettra également de nouvelles interfaces d'alimentation. Il est rapporté que Nvidia a fixé des exigences claires selon lesquelles, à l'avenir, chaque série GeForce RTX50 sera équipée d'une interface d'alimentation PCIeGen6 à 16 broches pour simplifier la chaîne d'approvisionnement. Les captures d'écran jointes à ce site sont les suivantes : Tom a également dit que GeForceRTX5090

De nombreux utilisateurs sont curieux de connaître la toute nouvelle carte graphique RTX5090 de nouvelle génération. Ils ne savent pas à quel point les performances de cette carte graphique ont été améliorées par rapport à la génération précédente. À en juger par les informations actuelles, les performances globales de cette carte graphique sont. toujours très bon. L'amélioration des performances du RTX5090 est-elle évidente ? Réponse : Elle est toujours très évidente. 1. Cette carte graphique a une fréquence d'accélération au-delà de la limite, jusqu'à 3 GHz, et est également équipée de 192 multiprocesseurs de streaming (SM), qui peuvent même générer jusqu'à 520 W de puissance. 2. Selon les dernières nouvelles de RedGamingTech, NVIDIARTX5090 devrait dépasser la fréquence d'horloge de 3 GHz, ce qui jouera sans aucun doute un rôle plus important dans l'exécution d'opérations graphiques et de calculs difficiles, offrant ainsi des jeux plus fluides et plus réalistes.

Selon les informations de ce site du 22 février, d'une manière générale, NVIDIA et AMD ont des restrictions sur les prix des chaînes, et certains revendeurs qui réduisent considérablement les prix en privé seront également punis. Par exemple, AMD a récemment puni les revendeurs qui vendaient des cartes graphiques 6750GRE à des prix inférieurs. le prix minimum. Le commerçant a été puni. Ce site a remarqué que les NVIDIA GeForce RTX 4070 et 4060 Ti sont tombées à des niveaux record. La version de leur fondateur, c'est-à-dire la version publique de la carte graphique, peut actuellement recevoir un coupon de 200 yuans dans la boutique auto-gérée de JD.com, avec. prix de 4 599 yuans et 2 999 yuans. Bien sûr, si l’on considère les magasins tiers, les prix seront plus bas. En termes de paramètres, la carte graphique RTX4070 possède un cœur 5888CUDA, utilise 12 Go de mémoire GDDR6X et une largeur de bits de 192bi.

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Selon les informations de ce site le 2 juin, lors du discours d'ouverture du Huang Renxun 2024 Taipei Computex, Huang Renxun a présenté que l'intelligence artificielle générative favoriserait la refonte de l'ensemble de la pile logicielle et a démontré ses microservices cloud natifs NIM (Nvidia Inference Microservices). . Nvidia estime que « l'usine IA » déclenchera une nouvelle révolution industrielle : en prenant comme exemple l'industrie du logiciel lancée par Microsoft, Huang Renxun estime que l'intelligence artificielle générative favorisera sa refonte complète. Pour faciliter le déploiement de services d'IA par les entreprises de toutes tailles, NVIDIA a lancé les microservices cloud natifs NIM (Nvidia Inference Microservices) en mars de cette année. NIM+ est une suite de microservices cloud natifs optimisés pour réduire les délais de commercialisation

Récemment, la blockchain Layer1 VanarChain a attiré l'attention du marché en raison de son taux de croissance élevé et de sa coopération avec le géant de l'IA NVIDIA. Derrière la popularité de VanarChain, en plus de subir de multiples transformations de marque, des concepts populaires tels que les jeux principaux, le métaverse et l'IA ont également valu au projet beaucoup de popularité et de sujets. Avant sa transformation, Vanar, anciennement TerraVirtua, a été fondée en 2018 en tant que plate-forme prenant en charge les abonnements payants, fournissant du contenu de réalité virtuelle (VR) et de réalité augmentée (AR) et acceptant les paiements en crypto-monnaie. La plateforme a été créée par les cofondateurs Gary Bracey et Jawad Ashraf, Gary Bracey possédant une vaste expérience dans la production et le développement de jeux vidéo.

Selon les informations de ce site du 17 avril, TrendForce a récemment publié un rapport estimant que la demande pour les nouveaux produits de la plate-forme Blackwell de Nvidia est haussière et devrait entraîner une augmentation de la capacité totale de production d'emballages CoWoS de TSMC de plus de 150 % en 2024. Les nouveaux produits de la plate-forme Blackwell de NVIDIA comprennent des GPU de série B et des cartes accélératrices GB200 intégrant le propre processeur GraceArm de NVIDIA. TrendForce confirme que la chaîne d'approvisionnement est actuellement très optimiste quant au GB200. On estime que les livraisons en 2025 devraient dépasser le million d'unités, représentant 40 à 50 % des GPU haut de gamme de Nvidia. Nvidia prévoit de livrer des produits tels que le GB200 et le B100 au second semestre, mais le conditionnement des plaquettes en amont doit encore adopter des produits plus complexes.
