Moins d'un an après la sortie de GPT-3.5 à l'étranger, moins de six mois après la sortie de Wenxinyiyan en Chine, la Chine a avancé rapidement vers la « Bataille des 100 modèles ». Parmi les participants figurent à la fois de grands fabricants et un grand nombre de start-up. Cependant, la concurrence pour les grands modèles est féroce, et si les utilisateurs professionnels n’ont pas l’œil vif, ils risquent de tomber dans le piège, ce qui rendra le projet inachevé.
L'écart entre les grands modèles de certains grands fabricants, comme Wenxin Large Models, Tongyi Qianwen, Pangu Large Models, etc., se creuse progressivement. La dernière liste d'évaluation de SuperCLUE montre que Wen Xinyiyan a dépassé le GPT-3.5turbo et que les grands modèles nationaux tels que le GLM-130B sont également en tête de liste. Les grands modèles nationaux sont devenus une partie importante du monde en termes de quantité et rattrapent rapidement le GPT-4 le plus avancé en termes de qualité.
Derrière la « Bataille des 100 modèles », l'industrie est optimiste quant au fait que l'innovation technologique des grands modèles favorisera la numérisation industrielle et créera des milliards de valeur marchande. Du point de vue actuel, les grands modèles « produits par les grands fabricants » représentés par Wen Xinyiyan et Tongyi Qianwen occupent une position dominante au niveau technique, et ont également gagné davantage de coopération en matière de projets en construisant une écologie industrielle.
Pourquoi les grands modèles produits par les grands constructeurs sont-ils plus puissants et plus appréciés des clients que les start-up ? De l'avis de l'auteur, il y a trois raisons principales :
Tout d'abord, les grands modèles doivent à terme être appliqués dans des scénarios industriels, et il ne s'agit pas d'un simple « one-shot deal ». Symbole d’une plus grande stabilité, sécurité et fiabilité, les grands fabricants disposent généralement d’une accumulation suffisante de bases technologiques en matière d’IA. Les entreprises clientes ont tendance à se concentrer sur le niveau des applications et n’ont pas nécessairement une forte accumulation de technologies d’IA sous-jacentes. De grands fabricants tels que Baidu, Alibaba et Huawei ont construit des bases d'IA qui ont été testées en combat réel. En ce qui concerne les startups, il existe de nombreux points forts et avancées en matière d'innovation technologique. Cependant, du point de vue de l'accumulation et de l'accumulation de bases technologiques d'IA complètes. service client stable et à long terme. La capacité globale et la durée de vie de la batterie sont encore discutables.
Deuxièmement, les grands fabricants disposent d'une force globale plus forte pour investir dans le développement itératif de la technologie des grands modèles. Par exemple, Baidu peut mobiliser l'ensemble du groupe pour développer Wenxin Yiyan. La dernière itération de Wenxin Big Model 3.5 a une vitesse d'inférence 17 fois plus rapide que la version 3.0 et l'effet de modèle est amélioré de plus de 50 %. En revanche, la start-up la plus populaire, à des années-lumière, a choisi de « vendre » à Meituan en moins de six mois. Certains grands modèles développés sur la base de technologies open source ne disposent pas d’une accumulation technologique sous-jacente suffisante et de capacités de développement autonomes.
Selon le dernier « Rapport d'évaluation des capacités techniques des grands modèles d'IA, 2023 » publié par la société d'études de marché IDC, Baidu Wenxin Large Model 3.5 a obtenu 7 scores parfaits dans 12 indicateurs, dont « Modèle d'algorithme » et « Couverture de l'industrie ». Deux indicateurs clés Alibaba Tongyi Large Model, qui s'est classé deuxième, a reçu des notes complètes dans 6 indicateurs sur 11 et a été le seul fabricant à obtenir des notes complètes pour les « capacités de service ».
Troisièmement, la mise en œuvre de grands modèles dans des scénarios industriels, la prestation de services ultérieure, l'exploitation et la maintenance, etc. sont « faciles à maîtriser » pour les grands fabricants, mais constituent des défis difficiles pour les entreprises en démarrage. Les grands fabricants peuvent équiper les industries verticales et les clients clés d'équipes de service dédiées pour soulager les clients des inquiétudes liées à l'adoption de nouvelles technologies. Cependant, les start-up manquent souvent d'expérience dans le service aux clients gouvernementaux et aux entreprises. doit faire du bon travail dans tous les aspects. Le service du processus était à contrecœur.
Pour résumer, le grand modèle examine non seulement divers paramètres techniques, mais examine également la mise en œuvre de l'industrie, le « savoir-faire » et l'expérience réussie de l'industrie. Les produits fabriqués par les grands fabricants occupent actuellement une position dominante en termes de développement technologique, d'applications industrielles et de services. Bien entendu, la « Bataille des Cent Modèles » n'est peut-être pas la « Guerre des Cent Régiments » d'il y a plus de dix ans, avec au final seulement deux vainqueurs. Le grand modèle en est encore aux premiers stades de développement et il existe d'autres possibilités à l'avenir, notamment la possibilité de surpasser le GPT-4 et davantage de produits concurrents européens et américains.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!