Dans le jardin de l'IA générative, comment NVIDIA agit en

Maison

Périphériques technologiques

Dans le jardin de l'IA générative, comment NVIDIA agit en « creuseur »

PHPz

Jun 03, 2023 pm 06:08 PM

生成式AI的花园里英伟达如何做“挖掘工”

Pourquoi les GPU NVIDIA sont-ils chers ?

Auteur : Jiang Yue

Editeur : Tao Li Lu Taoran

Source de l'image : Picture Chong

« L'ère de l'expansion des processeurs est révolue », c'est ce qu'a annoncé le fondateur et PDG de NVIDIA, Jen-Hsun Huang, au Salon international de l'informatique de Taipei le 29 mai. "Au cours du discours qui a duré 2 heures, il a donné une introduction approfondie aux récents matériels, logiciels et nouveaux produits système de NVIDIA autour des "points déclencheurs" apportés par l'IA générative.

Huang Renxun a déclaré que le « nouvel ordinateur » façonné par GPU était arrivé. Le nouvel « ordinateur » construit par Nvidia a une forme différente de celle d'avant et son unité individuelle se vend jusqu'à 200 000 dollars américains. Au milieu de la controverse « coûteuse », Huang Renxun a également déclaré que GPU est le seul choix pour toute entreprise ayant un budget énergétique limité, et c'est également l'option d'infrastructure la plus « économe ».

Huang Renxun a récemment déclaré dans un discours public que face à l'ère de l'IA, les gens doivent « courir, pas marcher lentement ». Dans le jardin de l’IA générative, Nvidia creuse clairement fort.

Décodage des données GPU coût cardiaque

"Tout le monde dit toujours que les centres de données GPU sont chers, laissez-moi le calculer pour vous." Le 29 mai, le fondateur et PDG de NVIDIA, Jen-Hsun Huang, a présenté en détail le centre de données GPU au public au Salon international de l'informatique de Taipei.

NVIDIA a présenté son nouvel ordinateur IA DGX GH200 lors de réunions avec des fournisseurs et des clients. Il s’agit d’un supercalculateur intégrant 256 CPU et GPU les plus performants de Nvidia, capables de répondre aux besoins de formation des « très gros modèles ».

DGX GH200 utilise la technologie d'interconnexion NVIDIA NVLink-C2C pour interconnecter le processeur à architecture Grace basée sur Arm et le GPU à architecture Hopper, atteignant une bande passante totale allant jusqu'à 900 Go/s, soit 7 fois plus élevée que la voie PCIe Gen5 standard dans les systèmes d'accélération traditionnels. Aujourd’hui, ce type de puissance de calcul peut répondre aux applications génératives d’IA et HPC les plus exigeantes.

生成式AI的花园里英伟达如何做“挖掘工”

La photo montre la super puce GH200 Grace Hopper annoncée par NVIDIA le 29 mai

Photo gracieuseté de NVIDIA

À mesure que la demande du marché en matière d'infrastructure de centre de données augmente, NVIDIA doit désormais également utiliser certaines « méthodes de vente » sur le marché. Le besoin le plus urgent est de dissiper la crainte des gens que leur équipement soit « cher ».

En termes simples, « En utilisant les centres de données GPU, vous pouvez obtenir des performances 150 fois supérieures et économiser les 2/3 du coût. »

Huang Renxun a présenté qu'en prenant le même budget de 10 millions de dollars comme exemple, les développeurs d'AIGC peuvent construire un centre de données composé de 960 serveurs CPU, ce qui est suffisant pour former un grand modèle de langage, et la consommation de fonctionnement finale est de 11 gigawattheures de électricité (GWh, équivalent à 11 millions de kilowattheures d’électricité).

Mais si vous passez au GPU, vous pouvez construire un centre de données composé de 48 serveurs GPU. Cependant, ce centre de données peut former 44 grands modèles de langage, consommant un total de 3,2 gigawattheures (équivalent à 3,2 millions de kilowattheures d'électricité).

Selon la méthode de calcul ci-dessus, basée sur le prix d'une puce unique, le prix d'une puce GPU est 20 fois supérieur à celui d'un CPU, ce qui semble être « plus cher ». Cependant, selon la méthode de calcul du coût TCO du centre de données, le centre de données GPU permet davantage d'« économiser de l'argent ».

Huang Renxun a même répertorié une formule directement dans la démonstration PPT : coût de détention du centre de données = f {coût matériel (puce, système, écosystème matériel), débit (GPU, logiciel AIgo, réseau, logiciel système, écosystème logiciel)), utilisation ( AIgo Lib, écosystème logiciel), opérations d'approvisionnement, optimisation du cycle de vie, puissance de calcul}, expliquant ainsi la problématique du coût TCO du data center.

"Pourquoi est-ce important ? Parce que dans la vraie vie, la plupart des entreprises ont des restrictions de pouvoir." a encore souligné Huang Renxun. Lorsqu'elles investissent dans AIGC, en tenant compte de ce facteur objectif, les entreprises doivent choisir des produits de centre de données plus efficaces et à faible consommation d'énergie.

Pourquoi les GPU sont-ils si puissants dans les centres de données ? Selon Huang Renxun, cela est principalement dû à trois fonctions principales : le traçage de rayons (simulant les caractéristiques de la lumière), l'intelligence artificielle avec le calcul tensoriel comme noyau et de nouveaux algorithmes.

Depuis 2017, NVIDIA a commencé à implémenter ces trois fonctions sur GPU en même temps, et son utilisation du GPU pour générer des images a surpris le marché pour la première fois. A cette époque, il fallait plusieurs heures pour "créer" une image à partir de rien à l'aide d'un serveur CPU (ce processus est appelé "rendu" dans le langage professionnel), mais Nvidia ne prenait que 15 secondes à l'aide d'un GPU.

Cependant, le soi-disant « bon marché » des nouveaux ordinateurs GPU ne s'adresse pas au marché grand public. Actuellement, les PC et ordinateurs portables dotés d'un processeur central sur le marché des ordinateurs personnels ne peuvent pas être remplacés car ils sont plus abordables.

Dans son discours, Jen-Hsun Huang a présenté un nouvel ordinateur GPU composé de 8 puces H100. "C'est l'ordinateur le plus cher du monde", a déclaré Huang Renxun.

Ce nouvel ordinateur pèse 65 livres (environ 29,5 kilogrammes) et nécessite l'aide d'un robot pour réaliser une installation fluide et précise. "Cet ordinateur se vend 200 000 dollars américains", a déclaré Huang Renxun.

Démarrer les changements dans l'industrie AIGC

Il s'agit d'une réécriture : la première étape de Nvidia pour conquérir la position de leader de l'AIGC est d'éliminer « l'ère des processeurs » en utilisant du matériel. À l'heure actuelle, NVIDIA a pris des dispositions minutieuses dans l'écosystème logiciel. En plus de promouvoir le modèle informatique CUDA auprès de 4 millions de développeurs de logiciels, elle a également lancé des services OEM de modèles d'IA de jeu et s'est approfondie dans l'industrie manufacturière pour prendre en charge les usines virtuelles et. simulations de robots. Technologie et détection automatisée.

"Pourquoi les gens ont-ils été incapables de créer une nouvelle méthode informatique pendant tant d'années ?", a déclaré Huang Renxun en parlant de l'ère du CPU. Il a souligné que Cela est dû au fait qu'il existe une relation « de la poule et de l'œuf » entre le matériel et les logiciels, le marché de consommation, les développeurs et les fournisseurs, ce qui conduit à une retenue mutuelle et permet à la méthode informatique basée sur le CPU de continuer pendant un certain temps. longue durée.

Par conséquent, afin de briser les chaînes de « l'ère du CPU », NVIDIA conçoit non seulement vigoureusement le matériel des puces, mais accorde également une grande attention à la création d'un environnement écologique logiciel. Le modèle informatique CUDA est un élément clé créé par NVIDIA pour cette configuration à long terme.

Plus de 3 000 applications et 4 millions de développeurs utilisent actuellement le modèle informatique NVIDIA Cuda. Rien qu'au cours de la dernière année, Cuda a été téléchargé 25 millions de fois et son nombre total de téléchargements a atteint 40 millions. " a déclaré Huang Renxun. Il a souligné qu'avec une si grande échelle de logiciels, il n'est possible que pour le GPU de remplacer le CPU.

Résumé du discours de deux heures de Huang Renxun, nous pouvons voir l'exploration par Nvidia du domaine AIGC, couvrant les superpuces de base, la technologie d'interconnexion, l'optimisation du moteur d'algorithme et la prise en charge des mises à niveau logicielles.

En fait, les textes, images, images 2D et images 3D impliqués dans AIGC sont implémentés via une variété de grands modèles ou applications, y compris le cadre open source de modèle d'IA conversationnel de NVIDIA NeMo et les grands modèles de Meta LLaMa, ChatGPT, une application en utilisant le modèle GPT et Stable Diffusion, une application graphique Vincent, etc.

Actuellement, les leaders technologiques AIGC les plus influents au monde utilisent en profondeur les outils fournis par NVIDIA, ce qui a également poussé NVIDIA à grimper le sommet de « 1 000 milliards de dollars américains » en valeur marchande sur le marché boursier américain, et sera bientôt en concurrence avec Apple, Microsoft, Google et Amazon font ensemble partie du « club du billion ».

Le marché a été surpris par le nombre d'outils que NVIDIA a apporté cette fois-ci à l'industrie de l'AIGC. En plus des produits ci-dessus, l'implication de NVIDIA dans la création de jeux à grande échelle et dans les usines numériques est également très accrocheuse.

En termes de création de jeu, Huang Jenxun a montré un clip de jeu. Dans ce clip, en plus de la production d'images réalistes, le dialogue entre les joueurs et les PNJ a également été entièrement généré par l'AIGC. En d’autres termes, les futurs jeux pourront avoir « des milliers de visages » et les joueurs ne seront plus confrontés à des PNJ qui ne donnent que des réponses structurées. ACE Game Development Edition est un service de fonderie de modèles d'IA fourni par NVIDIA, qui peut aider les développeurs de jeux à utiliser facilement cette fonctionnalité.

NVIDIA a également annoncé que certains grands fabricants d'électronique utilisent désormais l'AIGC et la plate-forme omniverse de NVIDIA pour réaliser la « numérisation » des usines.

Dans le secteur manufacturier, il existe environ 10 millions d’usines dans le monde, et ce sont des domaines clés pour la numérisation industrielle.

Huang Renxun a déclaré :"La fabrication industrielle est composée uniquement d'objets physiques. Si les produits peuvent d'abord être fabriqués numériquement, des milliards de dollars peuvent être économisés."

À l'heure actuelle, dans le domaine industriel, NVIDIA crée principalement l'IA Omniverse et générative pour aider les usines à concevoir des usines virtuelles. Elle lance également les robots de simulation et de test Isaac Sim et les outils d'automatisation de l'inspection optique Metropolis.

Il est entendu que les fabricants d'équipements électroniques tels que Foxconn, Pegatron et Quanta utilisent déjà les outils de NVIDIA mentionnés ci-dessus pour accélérer la production et l'assemblage d'ordinateurs portables et de smartphones.

21Tech

Chronique spéciale du Groupe Nancai

Recommandations précédentes

De l’Internet industriel à l’AIGC : comment la fabrication intelligente franchit-elle le pas ?

05-30

Honorez le PDG Zhao Ming : Développer une stratégie de puces à la demande et maintenir le ratio de R&D à 10 % en 2023

05-30

Les fabricants de téléphones mobiles rivalisent pour l'imagerie et les écrans pliables. Huawei explique les secrets techniques en détail

05-29

NVIDIA appelle à « courir au lieu de marcher » dans l'IA, à faire des efforts en matière de supercalcul et à éliminer l'ère du CPU

05-29

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

1 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7447

Tutoriel CakePHP

1374

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Sora vs Veo 2: Laquelle crée des vidéos plus réalistes? Mar 10, 2025 pm 12:22 PM

Veo 2 de Google et Sora d'Openai: Quel générateur de vidéos AI règne en suprême? Les deux plates-formes génèrent des vidéos d'IA impressionnantes, mais leurs forces se trouvent dans différents domaines. Cette comparaison, en utilisant diverses invites, révèle quel outil répond le mieux à vos besoins. T

Google & # 039; s Gencast: Prévision météorologique avec Mini démo Gencast Mar 16, 2025 pm 01:46 PM

Gencast de Google Deepmind: une IA révolutionnaire pour les prévisions météorologiques Les prévisions météorologiques ont subi une transformation spectaculaire, passant des observations rudimentaires aux prédictions sophistiquées alimentées par l'IA. Gencast de Google Deepmind, un terreau

Chatgpt 4 o est-il disponible? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

Quelle IA est la meilleure que Chatgpt? Mar 18, 2025 pm 06:05 PM

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

O1 vs GPT-4O: le nouveau modèle Openai est-il meilleur que GPT-4O? Mar 16, 2025 am 11:47 AM

O1'S O1: Une vague de cadeaux de 12 jours commence par leur modèle le plus puissant à ce jour L'arrivée de décembre apporte un ralentissement mondial, les flocons de neige dans certaines parties du monde, mais Openai ne fait que commencer. Sam Altman et son équipe lancent un cadeau de don de 12 jours

See all articles