


La demande de puissance de calcul a explosé sous la vague des grands modèles d'IA. Le « grand modèle + grande puissance de calcul » de SenseTime permet le développement de plusieurs industries.
Récemment, la « Conférence sur l'informatique intelligente de la nouvelle zone de Lingang » a eu lieu sur le thème « L'IA mène l'ère, la puissance de calcul conduit l'avenir ». Lors de la réunion, la New Area Intelligent Computing Industry Alliance a été officiellement créée. SenseTime est devenu membre de l'alliance en tant que fournisseur de puissance de calcul. Dans le même temps, SenseTime a reçu le titre d'entreprise de « New Area Intelligent Computing Industry Chain Master ».
En tant que participant actif de l'écosystème de puissance de calcul Lingang, SenseTime a actuellement construit l'une des plus grandes plates-formes informatiques intelligentes d'Asie - SenseTime AIDC, qui peut produire une puissance de calcul totale de 5 000 pétaflops et prendre en charge 20 projets avec des centaines de milliards de paramètres. De très grands modèles sont entraînés simultanément. SenseCore, un dispositif à grande échelle basé sur AIDC et construit de manière tournée vers l'avenir, s'engage à créer une infrastructure et des services d'IA de nouvelle génération à haute efficacité, à faible coût et à grande échelle, permettant un nouveau paradigme de production d'intelligence artificielle, et deviendra un service d'infrastructure à l'ère de l'AGI.
Sous la vague des grands modèles d'IA, la demande en puissance de calcul a explosé
Les trois éléments majeurs de l’intelligence artificielle comprennent principalement les données, les algorithmes et la puissance de calcul. Selon des données récemment publiées par OpenAI, la puissance de calcul utilisée dans les tâches de formation à l'intelligence artificielle a augmenté de façon exponentielle depuis 2012, avec un taux de croissance doublant tous les 3,5 mois. Jusqu'à présent, la demande de puissance de calcul a été multipliée par plus de 300 000. La popularité de ChatGPT a déclenché de nouvelles demandes de puissance de calcul sur le marché.
À l'heure actuelle, le marché de la puissance de calcul de mon pays continue de croître. Selon les estimations de l'Académie des technologies de l'information et des communications, la puissance de calcul totale des équipements informatiques de mon pays atteindra 202 EFlops en 2021, avec un taux de croissance d'environ 50 %. , ce qui est supérieur au taux de croissance mondial.
Dans ce contexte, Shanghai Lingang exploite activement les avantages et l'attrait écologique de l'industrie informatique locale et a publié le « Plan d'action de la nouvelle zone de Lingang pour accélérer la construction d'un écosystème de l'industrie informatique » (ci-après dénommé le « Plan »).
Selon les rapports, l'industrie de la puissance de calcul dans la nouvelle zone de Lingang a pris des dispositions correspondantes en matière de logiciels et de matériel en amont, de centres de données intermédiaires, de plates-formes de répartition et d'applications en aval. À l'heure actuelle, la puissance de calcul totale de Lingang dépasse 3EFLOPS (FP32) et. la proportion de puissance de calcul intelligente est de près de 80 % et la puissance de calcul totale représente près de 20 % de Shanghai.
Le « Plan » propose que d'ici 2025, la nouvelle zone de Lingang formera un système d'alimentation en énergie de calcul diversifié qui se concentrera sur la puissance de calcul intelligente et coordonnera la puissance de calcul de base et la puissance de calcul totale. La puissance de calcul totale dépasse 5EFLOPS (FP32), IA La proportion. La puissance de calcul a atteint 80 % et la taille globale de l'industrie de la puissance de calcul a dépassé 10 milliards de yuans. Une plate-forme publique de services de puissance de calcul a été construite, le mécanisme d'échange de puissance de calcul a été standardisé et la répartition régionale de la puissance de calcul a été réalisée. et un cluster industriel de puissance de calcul avec une influence nationale a été construit. Un lot de scénarios de référence d'applications de démonstration de puissance de calcul.
Xu Li, président-directeur général de SenseTime, a déclaré que la puissance de calcul est la source d'énergie de la nouvelle ère. Dans une certaine mesure, la puissance de calcul détermine la compétitivité du marché. "La puissance de calcul est une expression des capacités de l'ensemble du modèle, qui est égale aux paramètres de l'algorithme ou du grand modèle multipliés par la quantité de données qu'il traite. À l'ère des grands modèles, plus les paramètres sont grands, plus la quantité de données est grande. les données se multiplient, et plus la puissance de calcul requise est grande.
Dans le même temps, la Lingang New Area Intelligent Computing Industry Alliance a été officiellement créée. Les membres de l'alliance industrielle sont représentés par 25 entreprises et 3 universités et instituts de recherche. À l'avenir, le partage des ressources, les échanges techniques et la coopération sur les projets seront assurés. réalisée pour promouvoir de nouveaux films. L'application de l'industrie informatique intelligente dans le district favorise le développement économique.SenseTime a reçu le titre de « Leader de la chaîne industrielle de l'informatique intelligente dans la nouvelle zone ». Le centre de calcul intelligent SenseTime situé dans la nouvelle zone de Lingang assume la tâche importante de mener à bien la recherche, le développement et l'industrialisation de l'intelligence artificielle. dans le delta du fleuve Yangtze et participera activement à l’avenir à l’intégration collaborative et au développement groupé de la chaîne industrielle de l’informatique intelligente de Hong Kong.
Grand modèle + innovation d'intégration de grande puissance de calcul
L'intégration de grands modèles et d'une grande puissance de calcul provoque un changement majeur dans le paradigme de production, poussant la recherche scientifique et les applications industrielles vers l'ère de l'intelligence artificielle générale (AGI) pilotée par l'informatique intelligente. Aux premiers stades d’une itération technologique rapide, l’industrie doit de toute urgence construire une nouvelle génération d’infrastructures pour abaisser les seuils d’application, raccourcir les cycles de R&D et améliorer l’efficacité de l’innovation.SenseTime Technology a présenté ses plans à l'avance et a passé cinq ans à construire SenseCore, un grand appareil de SenseTime. Sur cette base, elle a construit le système de grands modèles « SenseTime New SenseNova » pour fournir à l'industrie des services d'algorithmes de grands modèles, des formations et des services. inférence. Infrastructure AGI qui combine des logiciels et du matériel tels que des services d'optimisation et de données.
Selon les rapports, SenseCore, un grand appareil de SenseTime, utilise le centre de calcul d'intelligence artificielle SenseTime (appelé « SenseTime Intelligent Computing Center ou SenseTime AIDC ») comme base de puissance de calcul. Il contient 27 000 GPU et peut produire une puissance de calcul totale. puissance de 5 000 pétaflops. Avec des capacités de puissance de calcul de pointe, une formation de modèles ultra-larges et des capacités de raisonnement à grande échelle, il s'agit actuellement de l'une des plus grandes plates-formes informatiques intelligentes d'Asie.
La puissance de calcul actuelle de SenseCore, un grand appareil de SenseTime, peut prendre en charge la formation simultanée de 20 modèles ultra-larges avec des centaines de milliards de paramètres et fournit un système de services d'infrastructure de grands modèles unique couvrant les données, les outils de formation, l'inférence. déploiement et optimisation des performances.
Le grand appareil de SenseTime possède d'excellentes capacités de calcul parallèle et peut effectuer une formation à une seule tâche avec un cluster de 3 200 cartes maximum, et peut réaliser une formation stable et ininterrompue pendant plus de sept jours. Il prend non seulement en charge les grands projets de formation de modèles de SenseTime, mais également les formations. modèles personnalisés par d’autres sociétés.
De plus, les appareils à grande échelle SenseTime intègrent les capacités de base de l'IA, du supercalcul et du Big Data, grâce à un calcul haute performance, un stockage et une mise en cache hautes performances et des réseaux hautes performances optimisés pour l'IA, permettant ainsi de séparer le stockage et l'informatique. , une élasticité à grande échelle, une planification tolérante aux pannes et d'autres fonctionnalités, prenant en charge de grands modèles sur des milliers de cartes et un stockage au niveau PB pour compléter la formation de grands modèles avec des milliards de paramètres.
Les produits de la plateforme SenseCore AI fournissent également des capacités de données, de formation et de raisonnement modulaires et complètes. Il peut réaliser des dizaines de milliards de gestion et de récupération de données, des services d'annotation manuelle et accélérer l'efficacité du développement de grands modèles d'IA. La quantification en un clic, le déploiement en un clic et l'application en un clic fournissent des outils permettant une vérification en ligne rapide des grands modèles et accélèrent l'innovation.
De plus, Big Device fournit également à ses clients et partenaires écologiques un grand modèle en tant que service MaaS complet, accélérant l'innovation et l'efficacité des applications des grands modèles.
Parmi eux, le service d'annotation de données automatisé peut multiplier par cent l'efficacité de l'annotation intelligente ; le service de déploiement d'inférence de grands modèles peut augmenter l'efficacité de l'inférence de grands modèles de 600 % ; le service de formation parallèle de grands modèles prend en charge une seule carte cluster 3200 ; Formation de modèles de paramètres denses de 500 milliards ; augmentation importante du modèle. Le service de formation en volume peut réduire les coûts de réglage fin supplémentaires de 90 %.
Le grand modèle SenseTime AI permet le développement multi-industriel
Permis par les gros appareils, SenseTime a connu un développement rapide dans le domaine des grands modèles.
Selon Xu Li, le grand modèle multimodal « Scholar 2.5 », qui a été open source en mars de cette année, a pris la tête de plus de 20 ensembles de données faisant autorité dans les trois tâches visuelles principales de détection, de segmentation et de classification. a offert des opportunités pour la conduite autonome, les robots, etc. Les tâches de scène courantes fournissent un soutien efficace et précis aux capacités de perception et de compréhension.
Pour la science fondamentale de l'intelligence artificielle (AI For Science), parmi les tâches de prévision météorologique et climatique, la prévision météorologique mondiale à moyen terme est l'une des tâches de prévision les plus importantes. Le grand modèle d'IA de prévisions météorologiques mondiales à moyen terme « Fengwu », lancé en avril de cette année, a permis pour la première fois de prévoir efficacement les principales variables atmosphériques à haute résolution pendant plus de 10 jours et a surpassé le modèle GraphCast dans 80 % des indicateurs d'évaluation. . Grâce à la modélisation des données atmosphériques mondiales à haute résolution, « Fengwu » peut également simuler des conditions météorologiques extrêmes telles que les typhons et prédire avec précision les trajectoires des typhons.
UniAD, la première solution de conduite autonome de bout en bout du secteur avec perception et prise de décision intégrées construite par SenseTime, surpasse la méthode SOTA dans un certain nombre d'ensembles de données et d'indicateurs clés, améliorant de 30 % la précision de la prédiction des lignes de voie et prédisant les mouvements. . L'erreur de déplacement est réduite de près de 40 % et l'erreur de planification est réduite de près de 30 %.
De plus, le grand modèle de télédétection SenseEarth 3.0 lancé par SenseTime le mois dernier possède non seulement les catégories d'interprétation les plus complètes du secteur, mais a également réalisé des percées technologiques dans de nombreux indicateurs tels que l'efficacité de l'interprétation, la capacité de généralisation et la précision de l'interprétation.
Xu Li a déclaré : « À l'ère AGI, la capacité d'un modèle peut être mesurée par la puissance de calcul. Nous utilisons SenseCore, un grand appareil de SenseTime, pour construire l'infrastructure de l'ère AGI. Nous mettons constamment à jour la vitesse d'itération du modèle. et des capacités de résolution de problèmes. Débloquez plus de possibilités avec AGI. »
Il est rapporté qu'en mai de cette année, SenseTime comptait plus de 40 clients principaux, dont plus de 10 grands clients modèles, couvrant des domaines de pointe tels que la conduite intelligente, les produits biopharmaceutiques, la conception de puces, les affaires intelligentes et la recherche scientifique universitaire. , et a Réalisé une livraison de grands modèles dans plus de 20 scénarios d'atterrissage.
Yang Fan, co-fondateur de SenseTime et président du groupe d'affaires des grands appareils, a déclaré que le développement des performances des grands modèles observé aujourd'hui est l'amélioration de la valeur technique apportée par l'augmentation continue de l'échelle des trois éléments de l'intelligence artificielle. , et c'est aussi la base de cette combinaison parfaite de capacités de R&D et de capacités d'ingénierie systématique. Ces trois éléments sont souvent réglés conjointement. L'optimisation des algorithmes, le tri et la sélection des données, et les plates-formes de puissance de calcul sont souvent interconnectées. Il est difficile de les transformer en liens séparés et de les réaliser seuls. C'est pourquoi nous devons construire une chaîne industrielle intelligente de l'énergie de calcul, car ce n'est que si davantage d'entreprises de la chaîne favorisent les échanges, la coopération, la réflexion et une coopération plus approfondie que nous pourrons faire mieux dans la nouvelle vague critique de progrès technologiques majeurs. et du soutien.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Récemment, la « Conférence sur l'informatique intelligente de la nouvelle zone de Lingang » a eu lieu sur le thème « L'IA mène l'ère, la puissance de calcul conduit l'avenir ». Lors de la réunion, la New Area Intelligent Computing Industry Alliance a été officiellement créée. SenseTime est devenu membre de l'alliance en tant que fournisseur de puissance de calcul. Dans le même temps, SenseTime a reçu le titre d'entreprise de « New Area Intelligent Computing Industry Chain Master ». En tant que participant actif à l'écosystème de puissance de calcul de Lingang, SenseTime a actuellement construit l'une des plus grandes plates-formes informatiques intelligentes d'Asie : SenseTime AIDC, qui peut produire une puissance de calcul totale de 5 000 pétaflops et prendre en charge 20 modèles ultra-larges avec des centaines de milliards de paramètres. Entraînez-vous en même temps. SenseCore, un appareil à grande échelle construit avec AIDC comme base et tourné vers l'avenir, s'engage à créer une infrastructure et des services d'IA de nouvelle génération à haute efficacité, à faible coût et à grande échelle pour renforcer l'intelligence artificielle.

IT House a rapporté le 13 octobre que "Joule", une revue sœur de "Cell", a publié cette semaine un article intitulé "L'empreinte énergétique croissante de l'intelligence artificielle (L'empreinte énergétique croissante de l'intelligence artificielle)". Grâce à des enquêtes, nous avons appris que cet article avait été publié par Alex DeVries, fondateur de l'institution de recherche scientifique Digiconomist. Il a affirmé que les performances de raisonnement de l'intelligence artificielle à l'avenir pourraient consommer beaucoup d'électricité. On estime que d'ici 2027, la consommation électrique de l'intelligence artificielle pourrait être équivalente à la consommation électrique des Pays-Bas pendant un an. le monde extérieur a toujours pensé que la formation d'un modèle d'IA est « la chose la plus importante en IA ».

Driving China News le 28 juin 2023, aujourd'hui, lors du Mobile World Congress à Shanghai, China Unicom a publié le modèle graphique « Honghu Graphic Model 1.0 ». China Unicom a déclaré que le modèle graphique Honghu est le premier grand modèle pour les services à valeur ajoutée des opérateurs. Le journaliste de China Business News a appris que le modèle graphique de Honghu dispose actuellement de deux versions de 800 millions de paramètres de formation et de 2 milliards de paramètres de formation, qui peuvent réaliser des fonctions telles que des images basées sur du texte, le montage vidéo et des images basées sur des images. En outre, le président de China Unicom, Liu Liehong, a également déclaré dans son discours d'ouverture d'aujourd'hui que l'IA générative inaugure une singularité de développement et que 50 % des emplois seront profondément affectés par l'intelligence artificielle au cours des deux prochaines années.

Je crois que les amis qui suivent le cercle de la téléphonie mobile ne seront pas étrangers à l'expression « obtenez un score si vous ne l'acceptez pas ». Par exemple, les logiciels de tests de performances théoriques tels qu'AnTuTu et GeekBench ont beaucoup attiré l'attention des joueurs car ils peuvent refléter dans une certaine mesure les performances des téléphones mobiles. De même, il existe des logiciels d'analyse comparative correspondants pour les processeurs PC et les cartes graphiques afin de mesurer leurs performances. Puisque « tout peut être comparé », les grands modèles d'IA les plus populaires ont également commencé à participer à des concours d'analyse comparative, notamment dans les « Cent modèles » d'après. La "guerre" a commencé, des avancées ont été réalisées presque tous les jours et chaque entreprise a affirmé être "numéro un en termes de scores". Les grands modèles d'IA nationaux n'ont presque jamais pris de retard en termes de scores de performances, mais ils n'ont jamais été en mesure de surpasser GP en termes de performances. termes d’expérience utilisateur.

Le modèle Transformer est issu de l'article « Attentionisallyouneed » publié par l'équipe de Google en 2017. Cet article proposait pour la première fois le concept d'utiliser Attention pour remplacer la structure cyclique du modèle Seq2Seq, ce qui a eu un grand impact dans le domaine de la PNL. Et avec les progrès continus de la recherche ces dernières années, les technologies liées à Transformer sont progressivement passées du traitement du langage naturel à d’autres domaines. Jusqu'à présent, les modèles de la série Transformer sont devenus des modèles courants dans les domaines de la PNL, du CV, de l'ASR et d'autres domaines. Par conséquent, la manière de former et de déduire des modèles de transformateur plus rapidement est devenue une direction de recherche importante dans l'industrie. Les techniques de quantification de faible précision peuvent

IT House a rapporté le 3 novembre que le site officiel de l'Institut de physique de l'Académie chinoise des sciences a récemment publié un article sur le groupe SF10 de l'Institut de physique de l'Académie chinoise des sciences/Centre national de recherche sur la physique de la matière condensée de Pékin. et le Centre d'information sur les réseaux informatiques de l'Académie chinoise des sciences ont collaboré pour appliquer de grands modèles d'IA à la science des matériaux. Dans ce domaine, des dizaines de milliers de données sur les voies de synthèse chimique sont transmises au grand modèle de langage LLAMA2-7b, obtenant ainsi un modèle MatChat. , qui peut être utilisé pour prédire les voies de synthèse de matériaux inorganiques. IT House a noté que le modèle peut effectuer un raisonnement logique basé sur la structure interrogée et générer le processus de préparation et la formule correspondants. Il a été déployé en ligne et est ouvert à tous les chercheurs en matériaux, apportant une nouvelle inspiration et de nouvelles idées à la recherche et à l'innovation sur les matériaux. Ce travail concerne les grands modèles de langage dans le domaine de la science segmentée

Avec le développement rapide de l’industrie de l’intelligence artificielle, l’intelligence artificielle est commercialisée dans toutes les directions. La technologie de l'IA a été mise en œuvre dans de nombreux domaines tels que la finance, les soins médicaux, l'industrie manufacturière, l'éducation et la sécurité. Les scénarios d'application sont de plus en plus riches et l'importance des données est devenue de plus en plus importante. En tant que maillon essentiel de la chaîne industrielle de l’intelligence artificielle, la qualité et la quantité des données jouent un rôle clé dans l’amélioration de la précision et de la fiabilité des modèles d’IA. Aujourd’hui, l’intelligence artificielle (IA) se développe plus rapidement, autour de grands modèles, et entre à toute vitesse dans une nouvelle ère. En tant que représentant de services de données d'intelligence artificielle de haute qualité basés sur des scénarios, Cloud Measurement Data s'appuie sur ses capacités techniques de pointe, son excellente qualité de service et sa riche expérience du secteur pour fournir des services de données d'IA professionnels, efficaces et sûrs au secteur de l'intelligence artificielle.

Le 24 janvier 2022, le centre de calcul d'intelligence artificielle AIDC déployé par SenseTime dans la nouvelle zone de Lingang de la zone de libre-échange de Shanghai a officiellement lancé ses opérations. À ce moment-là, la société d’intelligence artificielle ne sera peut-être pas en mesure de prédire avec précision que 2022 deviendra la première année de ce qu’on appelle l’AIGC (AIGeneratedContent). «Aujourd'hui, notre Lingang AIDC dispose de près de 30 000 GPU (unités de traitement graphique) et notre puissance de calcul actuelle a atteint 5 000 PetaFLOPS (1 PetaFLOPS équivaut à 1 quadrillion d'opérations en virgule flottante par seconde). À l’avenir, nous pourrons avoir une meilleure efficacité des développeurs et être en mesure de prendre en charge une formation à la puissance de calcul de modèles à plus grande échelle, à une échelle de centaines de milliards. Le 2 juin, « l’IA mène l’ère et la puissance de calcul la conduit ».
