Meta lance continuellement l'IA pour accélérer le mouvement ultime ! La première puce d'inférence IA, supercalculateur IA spécialement conçu pour la formation de grands modèles-IA-php.cn

Maison

Meta lance continuellement l'IA pour accélérer le mouvement ultime ! La première puce d'inférence IA, supercalculateur IA spécialement conçu pour la formation de grands modèles

王林

May 25, 2023 pm 10:04 PM

meta、ai推理芯片、大模型训练

Meta lance continuellement lIA pour accélérer le mouvement ultime ! La première puce dinférence IA, supercalculateur IA spécialement conçu pour la formation de grands modèles

Compilé | Li Shuiqing

edit | 心元

zhixixi Actualités du 19 mai. Le 18 mai, heure locale, Meta a publié une annonce sur son site officiel afin de faire face à la forte croissance de la demande de puissance de calcul de l'IA au cours des dix prochaines années, Meta exécute un grand projet. plan - spécialement conçu pour l'infrastructure de nouvelle génération.

Meta a annoncé ses derniers progrès dans la construction d'une infrastructure de nouvelle génération pour l'IA, y compris la première puce personnalisée pour exécuter des modèles d'IA, une nouvelle conception de centre de données optimisée pour l'IA, le premier ASIC de transcodage vidéo et un GPU intégré de 16 000 blocs, l'IA supercalculateur RSC pour accélérer la formation en IA, etc.

Meta lance continuellement lIA pour accélérer le mouvement ultime ! La première puce dinférence IA, supercalculateur IA spécialement conçu pour la formation de grands modèles

▲Divulgation par le site officiel de Meta des détails de l'infrastructure de l'IA

Meta considère l’IA comme l’infrastructure de base de l’entreprise. Depuis que Meta a lancé la construction de son premier centre de données en 2010, l'IA est devenue le moteur de plus de 3 milliards de personnes utilisant chaque jour la famille d'applications Meta. Du matériel Big Sur en 2015 au développement de PyTorch, en passant par le déploiement initial du supercalculateur d'IA de Meta l'année dernière, Meta continue actuellement de mettre à niveau et de faire évoluer ces infrastructures.

1. Accélérateur d'inférence IA de première génération de Meta, processus 7 nm, puissance de calcul 102,4TOPS

MTIA (Meta Training and Inference Accelerator) est la première série de puces accélératrices personnalisées internes de Meta pour les charges de travail d'inférence.

Les charges de travail

IA sont omniprésentes dans les activités de Meta et constituent la base d'un large éventail de projets d'application, notamment la compréhension du contenu, le flux d'informations, l'IA générative et le classement des annonces. À mesure que la taille et la complexité des modèles d’IA augmentent, les systèmes matériels sous-jacents doivent fournir une augmentation exponentielle de la mémoire et des calculs tout en maintenant l’efficacité. Cependant, Meta a constaté qu'il était difficile pour les processeurs de répondre aux exigences de niveau d'efficacité requises par son échelle. Elle a donc conçu la série d'accélérateurs de formation et d'inférence auto-développée par Meta, la série MTIA ASIC, pour relever ce défi.

Depuis 2020, Meta a conçu le MTIA ASIC de première génération pour ses charges de travail internes. L'accélérateur utilise le processus 7 nm de TSMC, fonctionne à 800 MHz et fournit une puissance de calcul de 102,4TOPS avec une précision INT8 et une puissance de calcul de 51,2TFLOPS avec une précision FP16. Sa puissance thermique de conception (TDP) est de 25W.

Selon les rapports, le MTIA offre une puissance de calcul et une efficacité supérieures à celles du CPU. En déployant simultanément des puces MTIA et des GPU, il offrira de meilleures performances, une latence plus faible et une efficacité plus élevée pour chaque charge de travail.

2. Aménager le centre de données nouvelle génération et développer le premier ASIC de transcodage vidéo

La conception du centre de données de nouvelle génération de Meta prendra en charge ses produits actuels tout en prenant en charge la formation et l'inférence pour les futures générations de matériel d'IA. Ce nouveau centre de données sera optimisé pour l'IA, prenant en charge du matériel d'IA refroidi par liquide et un réseau d'IA haute performance connectant des milliers de puces d'IA pour des clusters de formation d'IA à l'échelle du centre de données.

Selon le site officiel, le centre de données de nouvelle génération de Meta sera également construit plus rapidement et de manière plus rentable, et sera complété par d'autres nouveaux matériels, tels que la première solution ASIC développée en interne par Meta, MSVP, conçue pour prendre en charge Croissance continue des charges de travail vidéo de Meta.

Avec l'émergence de nouveaux contenus technologiques tels que l'IA générative, la demande des gens en matière d'infrastructure vidéo s'est encore intensifiée, ce qui a incité Meta à lancer un processeur vidéo évolutif MSVP.

MSVP est le premier ASIC développé en interne par Meta pour le transcodage vidéo. MSVP est programmable et évolutif, et peut être configuré pour prendre en charge efficacement le transcodage de haute qualité requis pour la demande, ainsi que la faible latence et les temps de traitement plus rapides requis pour la diffusion en direct. À l'avenir, MSVP contribuera également à apporter de nouvelles formes de contenu vidéo à chaque membre de la famille d'applications Meta, y compris le contenu généré par l'IA ainsi que le contenu VR (réalité virtuelle) et AR (réalité augmentée).

Meta lance continuellement lIA pour accélérer le mouvement ultime ! La première puce dinférence IA, supercalculateur IA spécialement conçu pour la formation de grands modèles

▲Schéma d'architecture MSVP

3. Le supercalcul IA intègre 16 000 GPU et prend en charge les grands modèles LLaMA pour accélérer les itérations de formation

Selon l'annonce de Meta, son AI Super Computer (RSC) est l'un des superordinateurs d'intelligence artificielle les plus rapides au monde. Il est conçu pour former la prochaine génération de modèles d'IA à grande échelle et fournir de nouveaux outils de réalité augmentée et de compréhension du contenu. les systèmes et la technologie de traduction en temps réel, etc., fournissent de l’énergie.

Meta RSC comprend 16 000 GPU, tous accessibles via une structure de réseau Clos à trois niveaux, fournissant une bande passante complète à chacun des 2 000 systèmes de formation. Au cours de la dernière année, la RSC a fait la promotion de projets de recherche comme LLaMA.

LLaMA est un grand modèle de langage construit et open source par Meta plus tôt cette année, avec une échelle de 65 milliards de paramètres. Meta affirme que son objectif est de fournir un modèle plus petit et plus performant que les chercheurs peuvent étudier et affiner pour des tâches spécifiques sans avoir besoin de matériel important.

Meta a formé le LLaMA 65B et le plus petit LLaMA 33B sur la base de 1,4 billion de jetons. Son plus petit modèle, LLaMA 7B, utilise également mille milliards de jetons pour la formation. La capacité de fonctionner à grande échelle permet à Meta d'accélérer les itérations de formation et de réglage, publiant ainsi des modèles plus rapidement que les autres entreprises.

Conclusion : L'application de la technologie des grands modèles a contraint les grands fabricants à accélérer l'aménagement des infrastructures

Meta conçoit sur mesure la plupart de son infrastructure principalement parce que cela lui permet d'optimiser l'expérience de bout en bout, y compris de la couche physique à la couche logicielle en passant par l'expérience utilisateur réelle. La pile étant contrôlée de haut en bas, elle peut être personnalisée selon vos besoins spécifiques. Ces infrastructures aideront Meta à développer et à déployer des modèles d'IA plus grands et plus complexes.

Au cours des prochaines années, nous verrons une spécialisation et une personnalisation accrues dans la conception de puces, une infrastructure d'IA spécialisée et spécifique à la charge de travail, de nouveaux systèmes et outils, ainsi qu'une efficacité accrue dans le support produit et de conception. Ceux-ci fourniront des modèles et des produits de plus en plus sophistiqués, basés sur les dernières recherches, permettant aux utilisateurs du monde entier d'utiliser cette technologie émergente.

Source : Site officiel de Meta

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7517

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Chatgpt 4 o est-il disponible? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Apr 02, 2025 pm 06:10 PM

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

O1 vs GPT-4O: le nouveau modèle Openai est-il meilleur que GPT-4O? Mar 16, 2025 am 11:47 AM

O1'S O1: Une vague de cadeaux de 12 jours commence par leur modèle le plus puissant à ce jour L'arrivée de décembre apporte un ralentissement mondial, les flocons de neige dans certaines parties du monde, mais Openai ne fait que commencer. Sam Altman et son équipe lancent un cadeau de don de 12 jours

Google & # 039; s Gencast: Prévision météorologique avec Mini démo Gencast Mar 16, 2025 pm 01:46 PM

Gencast de Google Deepmind: une IA révolutionnaire pour les prévisions météorologiques Les prévisions météorologiques ont subi une transformation spectaculaire, passant des observations rudimentaires aux prédictions sophistiquées alimentées par l'IA. Gencast de Google Deepmind, un terreau

Quelle IA est la meilleure que Chatgpt? Mar 18, 2025 pm 06:05 PM

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

See all articles