Photo de Canva
Début 2023, la popularité explosive de ChatGPT a rapidement attiré l’attention de l’industrie sur les applications d’IA générative, et la concurrence pour les grands modèles d’IA s’est intensifiée.
En tant qu'acteur important impliqué, Alibaba Cloud a lancé pour la première fois le grand modèle Tongyi Qianwen lors du Alibaba Cloud Summit qui s'est tenu le 11 avril. Immédiatement après le 1er juin, Alibaba Cloud a annoncé les progrès du modèle à grande échelle Tongyi. Le nouveau produit d'IA « Tongyi Listening » axé sur le contenu audio et vidéo a été officiellement lancé, devenant ainsi le premier produit d'application de modèle à grande échelle en Chine ouvert au public. tests Cela signifie que le modèle de langage à grande échelle d'Alibaba Cloud a fait un autre grand pas vers les applications frontales. Dans le même temps, la sortie de son application de grand modèle basée sur l'IA équivaut à lancer un blockbuster sur la « mêlée de grand modèle » actuellement controversée.
La guerre des mille modèles est sur le point d'éclater
Ces derniers mois, alors que les grandes entreprises de la Silicon Valley telles que Microsoft, Google et Amazon ont annoncé de grands modèles et des progrès en matière d'AIGC, en lançant des concours d'IA via une série d'applications telles que les moteurs de recherche d'IA et les logiciels de bureautique d'IA, les sociétés nationales de cloud Internet ont également successivement L'armée a attaqué. Non seulement les grands fabricants, mais aussi de nombreuses start-ups, institutions de capital-risque/PE et des géants de divers secteurs se sont lancés dans la voie des grands modèles d'IA, essayant d'obtenir une part du gâteau. Selon des statistiques incomplètes, pas moins de 50 grandes entreprises ont annoncé leur intention de lancer des modèles d’IA à grande échelle, et d’innombrables autres participants.
D'un point de vue structurel, les sociétés de technologie Internet représentées par « BATH » et d'autres se sont fermement classées au premier échelon de l'industrie en raison de leur force globale telle que les scénarios, la puissance de calcul et les capacités techniques complètes, bien qu'importantes ; les entreprises industrielles de deuxième niveau, telles que SenseTime, China Telecom, JD.com, 360, etc., se sont appuyées sur leur influence dans des domaines connexes pour se classer au deuxième échelon de l'industrie, suivies de près par divers géants de l'industrie, dont Meituan ; co-fondateur Wang Huiwen, ancien PDG de Sogou Des entrepreneurs bien connus tels que Wang Xiaochuan ont des connaissances, un soutien institutionnel et une expérience pertinente, mais comme ils en sont encore au stade initial, ils sont temporairement classés au troisième échelon dans la mêlée des grandes IA modèles.
D'un point de vue classification, chaque entreprise a son propre positionnement et sa division du travail autour des grands modèles généraux et des grands modèles spéciaux. Selon les initiés de l'industrie, les grands modèles nationaux actuels peuvent être principalement divisés en deux catégories : l'une est un grand modèle général qui compare le GPT, en se concentrant sur les entreprises de niveau de base, telles qu'Alibaba, Baidu et d'autres entreprises ; source de grands modèles. Nous formons de grands modèles verticaux sur la plate-forme, en nous concentrant sur les entreprises des secteurs verticaux, tels que les grands modèles verticaux utilisés dans la finance, les soins médicaux, les transports et d'autres domaines. En raison des exigences techniques élevées et du coût élevé des premiers, de nombreuses industries ont commencé à coopérer avec des entreprises générales de grands modèles pour former de grands modèles verticaux adaptés à leurs propres industries en fonction de leurs propres conditions.
Du point de vue de la chaîne industrielle, les fabricants de puissance de calcul, les fabricants de services cloud et les fabricants d'applications frontales sont tous impliqués. Le système est complet, étroitement connecté et de vaste portée. Actuellement, y compris le fabricant de puissance de calcul NVIDIA, le fabricant de services cloud Alibaba Cloud et les fabricants d'applications frontales tels que Kingsoft Office, UFIDA et Yuncong Technology, ils participent tous activement à la recherche et au développement technologique et à la mise en œuvre de scénarios de grands modèles d'IA. Bref, la mêlée actuelle autour des grands modèles d’IA s’intensifie d’un coup.
Tongyi Tingwu a lancé le premier coup d'application de grand modèle
Du point de vue des niveaux impliqués dans les grands modèles d'IA, il peut être principalement divisé en quatre niveaux : couche application, couche modèle, couche cadre et couche puce. À l'heure actuelle, la plupart des entreprises du marché en sont encore à la couche modèle et le sont. impliqué à un niveau plus profond lorsqu'il s'agit de recherche sur la couche cadre et la couche puce, les applications frontales ne sont pas encore disponibles dans l'industrie. En tant que premier produit d'application de modèles à grande échelle du secteur en version bêta publique, l'effet de démonstration de Tongyi Tingwu est extrêmement évident.
D'une part, par rapport à la technologie sous-jacente, la valeur de la technologie proche du front-end de l'application sera plus imaginative. En regardant l'histoire de toutes les évolutions technologiques, il n'est pas difficile de constater que la valeur fondamentale de la technologie réside dans la popularité de son application et dans la mesure dans laquelle elle résout les problèmes des utilisateurs. Pour cette raison, les applications frontales qui assument cette responsabilité et cette mission disposent souvent d’une plus grande marge d’imagination.
Prenons comme exemple Tongyi Listening, lancé par Alibaba Cloud le 1er juin. En se connectant au grand modèle Tongyi d’Alibaba, son rôle n’est pas seulement un simple outil de transcription audio et vidéo, mais est devenu une aide. assistant pour les personnes dans les scénarios audio et vidéo. Il fournit aux utilisateurs une variété de services bureautiques tels que la prise automatique de notes, l'organisation d'entretiens et l'extraction de PPT. Il peut également convertir l'audio et la vidéo en contenu graphique, résumer chapitre par chapitre et résumer les opinions en texte intégral. a une capacité de récupération et de classification efficace « semblable à celle d'un humain ».
De plus, dans les scénarios subdivisés, il dispose également de nombreuses fonctions « trésor ». Par exemple, il peut ouvrir le plug-in Chrome. Les apprenants de langues étrangères et les personnes malentendantes peuvent utiliser la barre de sous-titres flottante bilingue pour regarder des vidéos sans sous-titres à tout moment. et n'importe où. En cas de conflit d'horaire, Tingwu peut également devenir un « remplaçant de réunion » pour les professionnels. Lorsque l'IA rejoint une réunion dans des conditions silencieuses, elle peut enregistrer la réunion et organiser les points clés en son nom ; être téléchargés sous forme de fichiers de sous-titres pour faciliter la post-production vidéo par les praticiens des nouveaux médias ; les questions et réponses triées par Tingwu Reviews permettent aux journalistes, analystes, avocats, RH et autres groupes d'organiser les entretiens plus efficacement. En bref, en termes de capacité à résoudre des problèmes de scène spécifiques, il a dépassé les capacités des applications audio et vidéo existantes et a également rafraîchi la limite supérieure de l'expérience utilisateur précédente. Cela fera certainement sensation dans l'industrie.
D'autre part, depuis Alibaba Cloud lui-même, le grand modèle Tongyi Qianwen vient d'être lancé, et il peut lancer rapidement des applications techniques basées sur le grand modèle AI, ce qui montre que le grand modèle Alibaba Cloud AI Le modèle est en effet relativement mature et possède des capacités d'application d'IA dérivées.
De la couche modèle à la couche application, des grands modèles d'IA à la naissance des applications grands modèles, cela semble simple mais en fait ce n'est pas facile à mettre en œuvre. D'une manière générale, les applications verticales sont mises en œuvre sur la base technique du grand modèle général, mises à part le grand modèle général, elles sont généralement impossibles à mettre en œuvre, ce qui nécessite que le grand modèle général sur lequel elles s'appuient soit suffisamment mature, sinon elles le seront. sera très difficile à mettre en œuvre. Il est difficile de lancer des applications relativement simples à utiliser et qui dépassent les capacités des produits existants. Prenons l'exemple de Tongyi Tingwu, sa force technique n'est pas partagée par tous les acteurs de l'industrie.
L'infrastructure d'IA du système complet est la clé de la victoire
Du point de vue des centaines de milliards d'exigences de formation de paramètres requis par le grand modèle d'IA lui-même, la difficulté et la complexité de son avancement peuvent dépasser de loin ce que le monde extérieur imagine. À long terme, seules les entreprises dotées de capacités techniques et de capacités d’infrastructure à grande échelle en matière d’IA full-stack seront en mesure d’aller plus loin.
Tout d'abord, étant donné que la vitesse de développement de l'IA générative dépasse de loin les attentes externes, la progression d'un seul lien a un effet limité sur la promotion de la formation globale de grands modèles. Selon les calculs d'OpenAI, depuis 2012, la demande mondiale de puissance de calcul pour la formation de modèles d'IA a doublé en 3 à 4 mois, avec un taux de croissance annuel allant jusqu'à 10 fois. Cependant, selon la loi de Moore, les performances informatiques des puces ne peuvent doubler que tous les 18 à 24 mois, ce qui signifie que les performances des puces sont loin de répondre aux exigences de développement des grands modèles d'IA. Spécifiques aux domaines connexes, les systèmes informatiques basés sur CPU sont difficiles à répondre aux exigences de transmission réseau à large bande passante et à faible latence pour la formation de grands modèles. Il est difficile de résoudre ces problèmes à court terme en s'appuyant sur une seule « pile de calcul ». power". , et peut ne pas être économique. Nous devons nous appuyer sur un support système global à plusieurs niveaux composé d'algorithmes, de puissance de calcul, de frameworks, etc. pour mieux faire face à ce changement.
Deuxièmement, en raison de la grande puissance de calcul requise pour développer de grands modèles à usage général, des coûts de formation d'inférence élevés et des exigences élevées en matière de volume de données, le seuil lui-même est très élevé et il n'a pas de scénario de développement de grands modèles full-stack. capacités de mise en œuvre et ouverture écologique. Les entreprises aux capacités limitées ont du mal à maintenir un taux de rotation rapide et peuvent facilement être éliminées. Selon une analyse réalisée par des experts du secteur, pour créer un grand modèle à usage général réussi pouvant être exporté pour une commercialisation externe, les fabricants doivent disposer d'une formation complète sur les grands modèles et de capacités de R&D, d'une expérience de mise en œuvre de scénarios commerciaux, de mesures de gouvernance de la sécurité de l'IA et l'ouverture écologique et d'autres avantages essentiels, et il est difficile pour les entreprises ordinaires de posséder pleinement ces capacités.
En tant que premier fournisseur de services de cloud computing en Asie et troisième au monde, Alibaba Cloud dispose du système de support de puissance de calcul le plus puissant de Chine. Par exemple, le système d'exploitation Alibaba Cloud Feitian Cloud peut atteindre une échelle de cluster unique de 100 000 unités et une capacité de calcul de 100 milliards de fichiers. Sa plate-forme informatique intelligente Feitian peut atteindre une efficacité parallèle de 90 % de 1 000 cartes. 10 000 cartes d'échelle. Les clusters d'IA offrent des capacités de communication de cluster hautes performances et sans encombrement. La propre plate-forme d'apprentissage en profondeur d'Alibaba Cloud, PAI, peut augmenter l'utilisation des ressources informatiques de plus de 3 fois, l'efficacité de la formation de l'IA de 11 fois et l'efficacité de l'inférence de 6 fois. . En outre, Alibaba Cloud a également pris l'initiative de créer la plus grande communauté de services de modèles d'IA « Magic » en Chine afin de réduire le coût du développement de grands modèles et de favoriser l'inclusivité de l'IA en termes d'algorithmes. Alibaba dispose de capacités linguistiques et multimodales avancées ; , les modèles ultra-grands et les modèles unifiés généraux. Dans de nombreuses dimensions techniques, il se situe au premier échelon en Chine. C'est la principale raison pour laquelle le grand modèle d'Ali Tongyi peut rapidement « sortir du cercle ».
Troisièmement, du point de vue des possibilités commerciales, les entreprises dotées de capacités d'infrastructure d'IA complètes auront une plus grande valeur commerciale après l'arrivée du MaaS (Model as a Service) et disposeront d'une plus grande « marge de manœuvre » dans la concurrence sur le marché. . Prenons l'exemple d'Alibaba Cloud. Dans la période ultérieure, vous pouvez non seulement obtenir des frais de service de plate-forme en fournissant des services généraux de grands modèles, mais vous pouvez également louer de la puissance de calcul et promouvoir des plates-formes de formation pour gagner un loyer. Dans un contexte de concurrence sur le marché, vous pouvez, en fonction de la situation, ajuster de manière flexible les prix des produits pour relever les défis opérationnels.
L'industrie inaugure l'ère de l'IA HP
Avec la naissance des applications d'IA à grand modèle, une nouvelle ère caractérisée par une profonde inclusivité de l'IA commence progressivement. L'IA est profondément ancrée dans les entités industrielles et deviendra une tendance irréversible de l'industrie.
D'une part, le seuil élevé des grands modèles généraux et le large éventail de besoins différenciés dans les domaines verticaux déterminent que les grands modèles exclusifs et les applications industrielles basées sur les grands modèles généraux deviendront la direction d'application principale à l'avenir, favorisant l'accélération entrée de l’IA dans des milliers d’industries. Comme mentionné ci-dessus, le seuil élevé pour les grands modèles à usage général détermine que seules quelques entreprises au pays et à l'étranger peuvent fabriquer de grands modèles à usage général. De plus, à mesure que les modèles d'IA deviennent plus grands, l'industrie de l'IA passe d'une lumière. L'intensification de l'industrie composée d'« ateliers artisanaux » nécessite une infrastructure systématique performante et peu coûteuse pour achever la production industrielle.
Non seulement de nombreuses petites et moyennes entreprises n'ont pas cette capacité, mais même pour les entreprises leaders dans divers secteurs, l'optimisation de la formation de grands modèles de 0 à 1 n'est pas économique en soi. Tous les horizons ont besoin d'une infrastructure d'IA suffisamment faible. en coût. Et pour les constructeurs existants, il n'est pas nécessaire de continuer à rejoindre ce domaine et de « réinventer la roue ». En revanche, le coût de formation des grands modèles verticaux est relativement faible, et certaines entreprises disposant de scénarios de données riches dans les domaines professionnels disposent de meilleures conditions pour créer de grands modèles verticaux et d'une meilleure qualité de données, et les produits qu'elles lancent sont plus adaptables à l'industrie verticale. Par conséquent, les GPT dans diverses industries verticales pourraient devenir des applications de grands modèles courantes à l’avenir, favorisant la pénétration rapide de l’IA dans l’industrie.
D'un autre côté, le goulot d'étranglement à court terme dans le développement de grands modèles d'IA est la puissance de calcul, et à long terme ce sont les données. Par conséquent, des applications frontales de haute qualité peuvent aider les entreprises à accumuler suffisamment d'actifs de données et à améliorer leurs ressources. compétitivité à long terme et accélérer le processus de vulgarisation des applications industrielles. Actuellement, l'itération et l'évolution rapides des grands modèles obligent tous les acteurs participants à accumuler continuellement des ressources informatiques et à optimiser les configurations sous divers aspects tels que les puces et les services cloud pour assurer la prise en charge de la puissance de calcul requise pour la formation des grands modèles. Cependant, à plus long terme, l'algorithme permettant de former de grands modèles d'IA sera continuellement optimisé et ajusté. Grâce aux avancées technologiques futures, la puissance de calcul ne sera peut-être plus un goulot d'étranglement et les ressources de données de haute qualité deviendront rares. ressource. , recevra plus d’attention.
En tant que première application du secteur basée sur de grands modèles d'IA, le lancement de Tongyi Tingwu aidera Alibaba à accélérer l'accumulation de ressources de données de haute qualité, à accélérer le processus d'inclusion industrielle et à jeter de bonnes bases pour un développement à long terme.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!