


La prochaine grande nouveauté en matière d'IA : performances maximales de la puce NVIDIA B100 et du modèle OpenAI GPT-5
Après les débuts de la NVIDIA H200, connue comme la puce d'IA la plus puissante au monde, l'industrie a commencé à attendre avec impatience la puce B100 plus puissante de NVIDIA. Dans le même temps, OpenAI, la start-up d'IA la plus populaire cette année, a commencé à attendre. a commencé à développer un modèle GPT-5 plus puissant et plus complexe.
Guotai Junan a souligné dans le dernier rapport de recherche que B100 et GPT5 aux performances illimitées devraient être publiés en 2024, ce qui constituera une mise à niveau majeure ou libérera une productivité sans précédent. L'agence s'est déclarée optimiste quant au fait que l'IA entrera dans une période de développement rapide et que sa visibilité se poursuivra jusqu'en 2024.
Par rapport aux générations de produits précédentes, quelle est la puissance du B100 et du GPT-5 ? Nvidia et OpenAI en ont déjà donné un aperçu : B100 pourrait être plus de 4 fois plus rapide que H100, et GPT-5 pourrait atteindre une super intelligence.
Dans la dernière présentation spéciale, NVIDIA a effectué une comparaison des performances entre B100 et A100, H100 et H200 exécutant GPT-3 175B, et est parvenu à des conclusions surprenantes
La vitesse d'inférence du H200 est 18 fois supérieure à celle de l'A100 sorti en 2020 et du B100 basé sur l'architecture Blackwell de nouvelle génération. Le graphique fourni par NVIDIA ne montre pas de chiffres précis, mais le site technologique Tweaktown comparera les histogrammes. des B100 et H100 Il a été constaté que le B100 est au moins 3 fois plus rapide que le H100. Traduisez ce contenu en chinois : Le H200 est 18 fois plus rapide que l'A100 sorti en 2020, et le B100 est basé sur l'architecture Blackwell de nouvelle génération. Bien que Nvidia n'ait pas fourni de chiffres précis, le site technologique Tweaktown l'a trouvé en comparant les histogrammes de. le B100 et le H100, le B100 est au moins 3 fois plus rapide que le H100
Concernant la configuration, selon l'article de Tweaktow, il est rapporté que le B100 contiendra 178 milliards de transistors intégrés, soit plus de deux fois le nombre de transistors GPU actuels, ce qui remet en question les limites de l'intégration des puces
B100 utilisera la dernière mémoire HBM3e de Micron, qui est la même que la H200 qui vient d'être lancée. De plus, le H200 prend en charge jusqu'à 141 Go de mémoire HBM3e avec une bande passante mémoire allant jusqu'à 4,8 To/seconde, de sorte que le monde extérieur peut s'attendre à une configuration de mémoire similaire pour le B100.
Il est rapporté que le B100 utilisera une conception interne de chiplet (petite puce), ce qui est la première tentative de Nvidia de rivaliser avec le prochain Instinct MI300 d'AMD
Le GPT n'est-il pas loin de la super intelligence ?
L'attention se tourne vers OpenAI, une start-up d'intelligence artificielle de grande envergure qui lance un modèle GPT-5 plus puissant et plus complexe
Le PDG d'OpenAI, Sam Altman, l'a confirmé dans une récente interview avec les médias et a affirmé qu'il pouvait atteindre la superintelligence.
Cependant, Altman n'a pas encore déterminé le calendrier de sortie de GPT-5, ni ses fonctionnalités possibles, car il n'y a aucun moyen de le savoir tant qu'il n'est pas terminé
Les capacités du GPT-4 sont assez impressionnantes, mais il n'est proche des humains qu'en termes de connaissances et de compréhension, et la prochaine génération de modèles d'intelligence artificielle surpassera non seulement les humains en termes de réserves de connaissances, mais aussi en termes de capacité à raisonner et traiter des idées complexes Comparable aux humains.
C'est ce qu'on appelle l'intelligence artificielle générale (AGI) dans l'industrie. Elle imite non seulement mécaniquement ce qui est donné, mais a également la capacité de créer et d'exprimer du contenu nouveau
La question est donc : que peut faire GPT-5 ? Cela peut-il contribuer à réduire considérablement la distance entre les humains et les AGI ?
Altman a également déclaré que la construction de GPT-5 nécessitera des investissements supplémentaires de la part de Microsoft pour devenir une réalité.
Microsoft a investi plus de 10 milliards de dollars américains dans OpenAI. Altman a déclaré qu'il espère que davantage de fonds pourront suivre, car le chemin vers l'AGI est encore long et nécessite la construction d'une grande quantité de puissance de calcul
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Selon les informations de ce site Web du 23 février, NVIDIA a mis à jour et lancé hier soir l'application NVIDIA, offrant aux joueurs un nouveau centre de contrôle GPU unifié, permettant aux joueurs de capturer des moments merveilleux grâce au puissant outil d'enregistrement fourni par le flotteur du jeu. fenêtre. Dans cette mise à jour, NVIDIA a également introduit la fonction RTXHDR. L'introduction officielle est jointe à ce site : RTXHDR est un nouveau filtre Freestyle basé sur l'IA qui peut introduire de manière transparente les superbes effets visuels de la plage dynamique élevée (HDR) dans les jeux qui ne le font pas. prend en charge à l'origine le HDR. Tout ce dont vous avez besoin est un moniteur compatible HDR pour utiliser cette fonctionnalité avec une large gamme de jeux basés sur DirectX et Vulkan. Une fois que le lecteur a activé la fonction RTXHDR, le jeu fonctionnera même s'il ne prend pas en charge la HD.

Selon les informations de ce site Web du 19 février, dans la dernière vidéo de la chaîne LawisDead de Moore, le présentateur Tom a révélé que les cartes graphiques de la série Nvidia GeForce RTX50 seront nativement équipées d'une interface d'alimentation PCIeGen6 à 16 broches. Tom a déclaré qu'en plus des séries haut de gamme GeForceRTX5080 et GeForceRTX5090, le GeForceRTX5060 de milieu de gamme permettra également de nouvelles interfaces d'alimentation. Il est rapporté que Nvidia a fixé des exigences claires selon lesquelles, à l'avenir, chaque série GeForce RTX50 sera équipée d'une interface d'alimentation PCIeGen6 à 16 broches pour simplifier la chaîne d'approvisionnement. Les captures d'écran jointes à ce site sont les suivantes : Tom a également dit que GeForceRTX5090

Selon les informations de ce site du 22 février, d'une manière générale, NVIDIA et AMD ont des restrictions sur les prix des chaînes, et certains revendeurs qui réduisent considérablement les prix en privé seront également punis. Par exemple, AMD a récemment puni les revendeurs qui vendaient des cartes graphiques 6750GRE à des prix inférieurs. le prix minimum. Le commerçant a été puni. Ce site a remarqué que les NVIDIA GeForce RTX 4070 et 4060 Ti sont tombées à des niveaux record. La version de leur fondateur, c'est-à-dire la version publique de la carte graphique, peut actuellement recevoir un coupon de 200 yuans dans la boutique auto-gérée de JD.com, avec. prix de 4 599 yuans et 2 999 yuans. Bien sûr, si l’on considère les magasins tiers, les prix seront plus bas. En termes de paramètres, la carte graphique RTX4070 possède un cœur 5888CUDA, utilise 12 Go de mémoire GDDR6X et une largeur de bits de 192bi.

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Selon les informations de ce site le 2 juin, lors du discours d'ouverture du Huang Renxun 2024 Taipei Computex, Huang Renxun a présenté que l'intelligence artificielle générative favoriserait la refonte de l'ensemble de la pile logicielle et a démontré ses microservices cloud natifs NIM (Nvidia Inference Microservices). . Nvidia estime que « l'usine IA » déclenchera une nouvelle révolution industrielle : en prenant comme exemple l'industrie du logiciel lancée par Microsoft, Huang Renxun estime que l'intelligence artificielle générative favorisera sa refonte complète. Pour faciliter le déploiement de services d'IA par les entreprises de toutes tailles, NVIDIA a lancé les microservices cloud natifs NIM (Nvidia Inference Microservices) en mars de cette année. NIM+ est une suite de microservices cloud natifs optimisés pour réduire les délais de commercialisation

Récemment, la blockchain Layer1 VanarChain a attiré l'attention du marché en raison de son taux de croissance élevé et de sa coopération avec le géant de l'IA NVIDIA. Derrière la popularité de VanarChain, en plus de subir de multiples transformations de marque, des concepts populaires tels que les jeux principaux, le métaverse et l'IA ont également valu au projet beaucoup de popularité et de sujets. Avant sa transformation, Vanar, anciennement TerraVirtua, a été fondée en 2018 en tant que plate-forme prenant en charge les abonnements payants, fournissant du contenu de réalité virtuelle (VR) et de réalité augmentée (AR) et acceptant les paiements en crypto-monnaie. La plateforme a été créée par les cofondateurs Gary Bracey et Jawad Ashraf, Gary Bracey possédant une vaste expérience dans la production et le développement de jeux vidéo.

Selon l'actualité de ce site du 23 janvier, selon le média technologique étranger Videocardz, sur la base des résultats des tests 3DMark, la carte graphique Nvidia GeForce RTX4070TiSuper est 15 % plus lente que la RTX4080 et 8 % plus rapide que la carte graphique RTX4070Ti. Selon les médias, plusieurs testeurs testent la carte graphique GeForce RTX4070TiSuper et annonceront les résultats détaillés des tests dans les prochains jours. L'un des évaluateurs a annoncé la nouvelle de manière anonyme sur le portail VideoCardz et a partagé les informations sur les performances de la carte graphique lors du test synthétique 3DMark. Ce site cite l’opinion des médias selon laquelle les scores suivants ne peuvent pas refléter pleinement les performances du RTX4070TiSuper. R.

Selon les informations de ce site du 17 avril, TrendForce a récemment publié un rapport estimant que la demande pour les nouveaux produits de la plate-forme Blackwell de Nvidia est haussière et devrait entraîner une augmentation de la capacité totale de production d'emballages CoWoS de TSMC de plus de 150 % en 2024. Les nouveaux produits de la plate-forme Blackwell de NVIDIA comprennent des GPU de série B et des cartes accélératrices GB200 intégrant le propre processeur GraceArm de NVIDIA. TrendForce confirme que la chaîne d'approvisionnement est actuellement très optimiste quant au GB200. On estime que les livraisons en 2025 devraient dépasser le million d'unités, représentant 40 à 50 % des GPU haut de gamme de Nvidia. Nvidia prévoit de livrer des produits tels que le GB200 et le B100 au second semestre, mais le conditionnement des plaquettes en amont doit encore adopter des produits plus complexes.
