Reconnaissance du premier prix du Science and Technology Progress Award : Tencent a résolu le problème de la formation de grands modèles avec des milliards de paramètres-IA-php.cn

Maison

Reconnaissance du premier prix du Science and Technology Progress Award : Tencent a résolu le problème de la formation de grands modèles avec des milliards de paramètres

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 27, 2024 pm 09:41 PM

产业腾讯云

La liste des gagnants des China Electronics Society 2023 Science and Technology Awards a été annoncée. Cette fois, nous avons trouvé un personnage familier : Tencent Angel Machine Learning Platform.

Avec le développement rapide des grands modèles, le Prix Science et Technologie est décerné aux projets de recherche et d'application des plateformes d'apprentissage automatique, affirmant pleinement la valeur et l'importance des plateformes de formation de modèles.

Reconnaissance du premier prix du Science and Technology Progress Award : Tencent a résolu le problème de la formation de grands modèles avec des milliards de paramètres

Le Prix Science et Technologie récompense la recherche et l'application de projets de plateformes d'apprentissage automatique, en particulier dans le contexte du développement rapide de modèles à grande échelle, et reconnaît pleinement la valeur et l'importance des plateformes de formation de modèles.

Avec l'essor du deep learning, les grandes entreprises ont commencé à prendre conscience de l'importance des plateformes d'apprentissage automatique dans le développement de la technologie de l'intelligence artificielle. Des entreprises telles que Google, Microsoft et Nvidia ont lancé leurs propres plateformes d'apprentissage automatique pour accélérer le processus de formation des modèles d'intelligence artificielle. Ces plates-formes offrent aux développeurs une assistance pratique, leur permettant de créer et d'optimiser plus rapidement des systèmes d'intelligence artificielle complexes. Cette tendance a incité les gens à accorder davantage d’attention au développement de la technologie d’apprentissage automatique et a jeté des bases solides pour les futures applications de l’intelligence artificielle.

À partir de 2023, la montée en puissance des modèles à grande échelle favorisera encore davantage l'augmentation du nombre de paramètres du modèle. Les grandes entreprises ont lancé des modèles avec des échelles de paramètres atteignant des centaines de milliards, voire des milliards, et ces modèles adoptent généralement des structures de réseaux neuronaux profonds. Cependant, ce développement a également entraîné deux problèmes majeurs : la difficulté de la formation distribuée des modèles et les défis de conception de modèles causés par la complexité des applications.

Pourquoi la plateforme d'apprentissage automatique Angel ?

Explication détaillée des quatre avancées technologiques fondamentales

Le comité d'évaluation composé d'un certain nombre d'académiciens et d'autres experts faisant autorité estime que la plate-forme d'apprentissage automatique Tencent Angel est techniquement complexe, difficile à développer, innovante, a de larges perspectives d'application, et la technologie globale a atteint le niveau avancé international, parmi lesquels la technologie efficace de planification et de gestion du cache pour la communication tout-à-tout, le pré-échantillonnage adaptatif et la technologie de recherche de structure graphique ont atteint le premier niveau international. El Architecture de la plateforme Tencent Angel

Reconnaissance du premier prix du Science and Technology Progress Award : Tencent a résolu le problème de la formation de grands modèles avec des milliards de paramètres

La plateforme d'apprentissage automatique Angel de Tencent utilise une architecture de serveur de paramètres distribués. Cette architecture se caractérise par les deux tâches des paramètres du modèle de stockage et des modèles d'exécution exécutés sur différents serveurs. En ajoutant plus de serveurs, des modèles plus grands avec des exigences de calcul plus élevées peuvent être pris en charge. Cette architecture rend le processus de formation des modèles plus efficace et peut gérer des ensembles de données à grande échelle et des calculs de modèles complexes. La conception du serveur de paramètres distribués permet au système d'avoir une bonne évolutivité et flexibilité, et peut répondre à des tâches d'apprentissage automatique de différentes échelles et besoins. L'avantage de cette architecture est qu'elle peut utiliser efficacement les ressources du cluster, améliorer l'efficacité informatique et fournir aux utilisateurs des solutions plus rapides et plus efficaces.

Face à des données massives et aux besoins de formation de modèles à très grande échelle, la plateforme d'apprentissage automatique Tencent Angel est en réseau communication et mise en cache, modèle Des percées techniques ont été réalisées dans des domaines clés tels que le stockage et la planification, les modèles multimodaux et le tri par apprentissage par fusion, ainsi que les modèles graphiques à grande échelle et la technologie de recherche de structure.

Afin d'améliorer l'efficacité de la formation, les modèles d'apprentissage automatique au niveau TB utilisent généralement des méthodes de formation distribuées, qui nécessitent un grand nombre de paramètres et une synchronisation par gradient. En prenant comme exemple l'entraînement en kilocalories du modèle 1.8T, le volume de communication IO. atteint 25 To et le ratio de consommation de temps 53 %. De plus, couplés à l'environnement réseau hétérogène entre les différents clusters de puissance de calcul et aux retards variables du réseau de communication, ceux-ci ont mis en avant des exigences plus élevées en matière de surcharge de communication lors de la formation du modèle. La plate-forme d'apprentissage automatique Tencent Angel est basée sur la technologie efficace de gestion de la communication et de la planification du cache du réseau Tencent Cloud Xingmai, qui peut résoudre efficacement le problème de la surcharge de communication élevée pour la formation des modèles au niveau de la To, réduire le temps de communication réseau de 80 % et obtenir une distribution distribuée. performance de formation qui atteint la solution dominante dans l'industrie 2,5 fois.

Reconnaissance du premier prix du Science and Technology Progress Award : Tencent a résolu le problème de la formation de grands modèles avec des milliards de paramètres Dans les conditions actuelles de puissance de calcul, bien que le modèle atteigne le niveau de la To, la mémoire vidéo du GPU grand public n'est toujours que de 80 Go et il existe un goulot d'étranglement dans le stockage des paramètres. En réponse au problème clé de la difficulté de stocker les paramètres de formation des modèles au niveau du téraoctet, la plate-forme d'apprentissage automatique Tencent Angel propose un mécanisme de gestion du stockage dans une perspective unifiée de la mémoire vidéo et de la mémoire principale, qui permet d'obtenir une capacité de stockage de modèles doublée par rapport à la l'industrie et une performance de formation deux fois supérieure à celle des solutions traditionnelles de l'industrie.

Pour développer un grand modèle en un modèle général, il est indissociable du support de traitement de données multimodales. L'alignement, la fusion et la compréhension de différentes modalités, telles que le texte, les images, les vidéos et autres données, sont difficiles à comprendre. Dans la formation de modèles multimodaux, la plateforme d'apprentissage automatique Tencent Angel propose une technologie de recommandation publicitaire de classement à liens complets basée sur l'apprentissage par fusion multimodale pour les scénarios publicitaires, contribuant ainsi à augmenter le taux de rappel publicitaire de plus de 40 %.

Reconnaissance du premier prix du Science and Technology Progress Award : Tencent a résolu le problème de la formation de grands modèles avec des milliards de paramètres

De plus, pour la formation de modèles de graphiques pour les systèmes de recommandation, la plate-forme d'apprentissage automatique Tencent Angel a conçu une technologie de recherche de structure de réseau de graphiques adaptative avec fonction de nœud de graphique, qui peut automatiquement générer la structure optimale et résoudre le "problème de graphique" dans le graphique TB. applications de modèle. Problème « L'exploration de données est difficile », les performances de formation du modèle sont améliorées de 28 fois et ont la meilleure évolutivité par rapport à l'industrie.

La route vers la création de la plateforme d'apprentissage automatique Tencent Angel

Le grand modèle Tencent Hunyuan étendu à des milliards d'échelle

En tant que plateforme de base de la technologie d'intelligence artificielle de Tencent, la plateforme Tencent Angel est née en 2015 et prend en charge PS-Worker la formation sur la formule de distribution et la formation d'un modèle LDA d'un milliard de paramètres.

En 2017, le framework Angel était open source sur Github et ouvert aux développeurs. En même temps, techniquement, Angel a résolu le problème de communication sous des réseaux hétérogènes et a encore amélioré les performances. En 2019, nous avons réalisé une percée dans la technologie de compréhension multimodale des modèles de graphiques évolutifs, résolvant le problème des modèles de graphiques évolutifs avec des milliards de nœuds. En 2021, une technologie de stockage en perspective unifiée de la mémoire GPU est proposée pour résoudre le problème du stockage et des performances des paramètres des grands modèles.

Dans la création du grand modèle d'intelligence artificielle générale de Tencent, Tencent Hunyuan, la plateforme d'apprentissage automatique Angel de Tencent a également joué un rôle important.

En septembre 2023, le grand modèle Hunyuan de Tencent a été officiellement dévoilé au public. Le corpus de pré-formation dépasse les 2 000 milliards de jetons et possède de solides capacités de compréhension et de création du chinois, des capacités de raisonnement logique et des capacités d'exécution de tâches fiables.

Face à la nécessité de créer de grands modèles Tencent Hunyuan, la plate-forme d'apprentissage automatique Tencent Angel a créé des cadres d'apprentissage automatique auto-développés Angel PTM et Angel HCF pour la formation et l'inférence de grands modèles, prenant en charge une tâche unique de niveau ultra-large de 10 000 ka. formation à grande échelle et déploiement de services d’inférence à grande échelle. L'efficacité de la formation de grands modèles est augmentée jusqu'à 2,6 fois celle des frameworks open source traditionnels. La formation de centaines de milliards de grands modèles peut permettre d'économiser 50 % des coûts de puissance de calcul. Après la mise à niveau, il prend en charge la formation à très grande échelle de 10 000 cartes. par tâche. En termes de raisonnement, la vitesse de raisonnement de la plate-forme d'apprentissage automatique Tencent Angel a été multipliée par 1,3. Dans l'application du grand modèle Tencent Hunyuan Wenshengtu, le temps de raisonnement est passé de 10 secondes d'origine à 3 à 4 secondes.

De plus, Angel fournit également une plate-forme unique allant du développement de modèles à la mise en œuvre d'applications, aidant les utilisateurs à appeler rapidement les capacités de grands modèles de Tencent Hunyuan via des interfaces API ou un réglage fin, accélérant la construction d'applications de grands modèles, les conférences Tencent, Tencent news , Tencent Video et plus de 400 produits et scénarios Tencent ont été connectés aux tests internes de Tencent Hunyuan.

Tencent Hunyuan a étendu le modèle à des milliards d'échelles de paramètres en adoptant une structure de modèle expert mixte (MoE), favorisant l'amélioration des performances et la réduction des coûts d'inférence. En tant que modèle général, Tencent Hunyuan est à la pointe de l'industrie en termes de performances chinoises, notamment en matière de génération de texte, de logique mathématique et de dialogue à plusieurs tours. Actuellement, Tencent Hunyuan développe également activement des modèles multimodaux pour améliorer encore les capacités des images et des vidéos Vincent.

Le grand nombre de scénarios d’application de Tencent fournissent un terrain expérimental pour la mise en œuvre de la plateforme d’apprentissage automatique Tencent Angel. En plus du grand modèle Hunyuan de Tencent, la plateforme d'apprentissage automatique Angel de Tencent prend également en charge des produits tels que la publicité Tencent et les conférences Tencent, et dessert de multiples secteurs et entreprises clientes via Tencent Cloud, aidant ainsi le développement numérique et intelligent de tous les horizons.

Prenons Tencent Advertising comme exemple, en utilisant des technologies innovantes telles que l'optimisation de la formation distribuée à plat d'apprentissage automatique Tencent Angel et l'exploration de données graphiques de compréhension multimodale, la vitesse de formation des grands modèles multimodaux dans les scénarios commerciaux publicitaires a été multipliée par 5 , et la taille du modèle a été multipliée par 10, permettant une augmentation significative du taux de mémorisation publicitaire.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Commandes de chat et comment les utiliser

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7529

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Aug 09, 2024 pm 04:01 PM

Mais peut-être qu’il ne pourra pas vaincre le vieil homme dans le parc ? Les Jeux Olympiques de Paris battent leur plein et le tennis de table suscite beaucoup d'intérêt. Dans le même temps, les robots ont également réalisé de nouvelles avancées dans le domaine du tennis de table. DeepMind vient tout juste de proposer le premier agent robot apprenant capable d'atteindre le niveau des joueurs amateurs humains de tennis de table de compétition. Adresse papier : https://arxiv.org/pdf/2408.03906 Quelle est la capacité du robot DeepMind à jouer au tennis de table ? Probablement à égalité avec les joueurs amateurs humains : tant en coup droit qu'en revers : l'adversaire utilise une variété de styles de jeu, et le robot peut également résister : recevoir des services avec des tours différents : Cependant, l'intensité du jeu ne semble pas aussi intense que le vieil homme dans le parc. Pour les robots, le tennis de table

La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison Aug 21, 2024 pm 07:33 PM

Le 21 août, la Conférence mondiale sur les robots 2024 s'est tenue en grande pompe à Pékin. La marque de robots domestiques de SenseTime, "Yuanluobot SenseRobot", a dévoilé toute sa famille de produits et a récemment lancé le robot de jeu d'échecs Yuanluobot AI - Chess Professional Edition (ci-après dénommé "Yuanluobot SenseRobot"), devenant ainsi le premier robot d'échecs au monde pour le maison. En tant que troisième produit robot jouant aux échecs de Yuanluobo, le nouveau robot Guoxiang a subi un grand nombre de mises à niveau techniques spéciales et d'innovations en matière d'IA et de machines d'ingénierie. Pour la première fois, il a réalisé la capacité de ramasser des pièces d'échecs en trois dimensions. grâce à des griffes mécaniques sur un robot domestique et effectuer des fonctions homme-machine telles que jouer aux échecs, tout le monde joue aux échecs, réviser la notation, etc.

Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances Sep 02, 2024 pm 01:56 PM

La rentrée scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui sont sur le point de commencer le nouveau semestre qui doivent prendre soin d’eux-mêmes, mais aussi les grands modèles d’IA. Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude. « Son niveau a beaucoup baissé, il fait souvent des pauses et même la sortie devient très courte. Au cours de la première semaine de sortie, il pouvait traduire un document complet de 4 pages à la fois, mais maintenant il ne peut même plus produire une demi-page. !" https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dans un post intitulé "Totalement déçu par Claude", plein de

Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré Aug 22, 2024 pm 10:35 PM

Lors de la World Robot Conference qui se tient à Pékin, l'exposition de robots humanoïdes est devenue le centre absolu de la scène. Sur le stand Stardust Intelligent, l'assistant robot IA S1 a réalisé trois performances majeures de dulcimer, d'arts martiaux et de calligraphie. un espace d'exposition, capable à la fois d'arts littéraires et martiaux, a attiré un grand nombre de publics professionnels et de médias. Le jeu élégant sur les cordes élastiques permet au S1 de démontrer un fonctionnement fin et un contrôle absolu avec vitesse, force et précision. CCTV News a réalisé un reportage spécial sur l'apprentissage par imitation et le contrôle intelligent derrière "Calligraphy". Le fondateur de la société, Lai Jie, a expliqué que derrière les mouvements soyeux, le côté matériel recherche le meilleur contrôle de la force et les indicateurs corporels les plus humains (vitesse, charge). etc.), mais du côté de l'IA, les données réelles de mouvement des personnes sont collectées, permettant au robot de devenir plus fort lorsqu'il rencontre une situation forte et d'apprendre à évoluer rapidement. Et agile

Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Les contributeurs ont beaucoup gagné de cette conférence ACL. L'ACL2024, d'une durée de six jours, se tient à Bangkok, en Thaïlande. ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. L'ACL s'est toujours classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A. La conférence ACL de cette année est la 62e et a reçu plus de 400 travaux de pointe dans le domaine de la PNL. Hier après-midi, la conférence a annoncé le meilleur article et d'autres récompenses. Cette fois, il y a 7 Best Paper Awards (deux inédits), 1 Best Theme Paper Award et 35 Outstanding Paper Awards. La conférence a également décerné 3 Resource Paper Awards (ResourceAward) et Social Impact Award (

Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Aug 08, 2024 am 07:02 AM

Cet après-midi, Hongmeng Zhixing a officiellement accueilli de nouvelles marques et de nouvelles voitures. Le 6 août, Huawei a organisé la conférence de lancement de nouveaux produits Hongmeng Smart Xingxing S9 et Huawei, réunissant la berline phare intelligente panoramique Xiangjie S9, le nouveau M7Pro et Huawei novaFlip, MatePad Pro 12,2 pouces, le nouveau MatePad Air, Huawei Bisheng With de nombreux nouveaux produits intelligents tous scénarios, notamment la série d'imprimantes laser X1, FreeBuds6i, WATCHFIT3 et l'écran intelligent S5Pro, des voyages intelligents, du bureau intelligent aux vêtements intelligents, Huawei continue de construire un écosystème intelligent complet pour offrir aux consommateurs une expérience intelligente du Internet de tout. Hongmeng Zhixing : Autonomisation approfondie pour promouvoir la modernisation de l'industrie automobile intelligente Huawei s'associe à ses partenaires de l'industrie automobile chinoise pour fournir

L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o Sep 03, 2024 pm 05:18 PM

Intégration profonde de la vision et de l'apprentissage des robots. Lorsque deux mains de robot travaillent ensemble en douceur pour plier des vêtements, verser du thé et emballer des chaussures, associées au robot humanoïde 1X NEO qui a fait la une des journaux récemment, vous pouvez avoir le sentiment : nous semblons entrer dans l'ère des robots. En fait, ces mouvements soyeux sont le produit d’une technologie robotique avancée + d’une conception de cadre exquise + de grands modèles multimodaux. Nous savons que les robots utiles nécessitent souvent des interactions complexes et exquises avec l’environnement, et que l’environnement peut être représenté comme des contraintes dans les domaines spatial et temporel. Par exemple, si vous souhaitez qu'un robot verse du thé, le robot doit d'abord saisir la poignée de la théière et la maintenir verticalement sans renverser le thé, puis la déplacer doucement jusqu'à ce que l'embouchure de la théière soit alignée avec l'embouchure de la tasse. , puis inclinez la théière selon un certain angle. ce

Conférence sur l'intelligence artificielle distribuée Appel à communications DAI 2024 : Agent Day, Richard Sutton, le père de l'apprentissage par renforcement, sera présent ! Yan Shuicheng, Sergey Levine et les scientifiques de DeepMind prononceront des discours d'ouverture Aug 22, 2024 pm 08:02 PM

Introduction à la conférence Avec le développement rapide de la science et de la technologie, l'intelligence artificielle est devenue une force importante dans la promotion du progrès social. À notre époque, nous avons la chance d’être témoins et de participer à l’innovation et à l’application de l’intelligence artificielle distribuée (DAI). L’intelligence artificielle distribuée est une branche importante du domaine de l’intelligence artificielle, qui a attiré de plus en plus d’attention ces dernières années. Les agents basés sur de grands modèles de langage (LLM) ont soudainement émergé. En combinant les puissantes capacités de compréhension du langage et de génération des grands modèles, ils ont montré un grand potentiel en matière d'interaction en langage naturel, de raisonnement par connaissances, de planification de tâches, etc. AIAgent reprend le grand modèle de langage et est devenu un sujet brûlant dans le cercle actuel de l'IA. Au

See all articles