Les grands modèles nationaux sont entrés dans une période de fonctionnement à long terme, passant du paramètre d'abord à la priorité pratique.
Le 7 septembre, lors de la conférence Tencent Global Digital Ecology 2023, le grand modèle Hunyuan de Tencent a été officiellement dévoilé et a annoncé qu'il serait ouvert au monde extérieur via Tencent Cloud.
Tencent Hunyuan Large Model est un grand modèle de langage universel auto-développé par Tencent Full Link. Il a une échelle de paramètres de plus de 100 milliards et un corpus de pré-formation de plus de 2 000 milliards de jetons. Il possède de fortes capacités de création chinoise. et un langage complexe. Capacité de raisonnement logique dans l'environnement et capacité d'exécution de tâches fiable.
Il convient de noter que le grand modèle Tencent Hunyuan est un grand modèle de niveau pratique qui « vient de la pratique et va à la pratique ». Plus de 50 entreprises et produits Tencent, dont Tencent Cloud, Tencent Advertising, Tencent Games, Tencent Financial Technology, Tencent Conference, Tencent Documents, WeChat Souyisou et QQ Browser, ont été connectés au grand modèle Tencent Hunyuan à des fins de test et ont obtenu les résultats initiaux. résultats. .
Il est entendu que le grand modèle Hunyuan servira de base au service Tencent Cloud MaaS. Les clients pourront non seulement appeler Hunyuan directement via l'API, mais également utiliser Hunyuan comme modèle de base pour créer des applications exclusives pour différents scénarios industriels. .
Tang Daosheng, vice-président exécutif principal du groupe Tencent et PDG du groupe Cloud and Smart Industry, a déclaré : « Avec la technologie de génération de grands modèles comme noyau, l'intelligence artificielle devient une force motrice clé pour le prochain cycle de développement numérique et fournit également des solutions aux problèmes de l'industrie. Les problèmes apportent de nouvelles idées. Les grands modèles doivent être basés sur des scénarios industriels et intégrés aux données de l'entreprise pour libérer la plus grande valeur " Jiuweigong, technologie de liaison complète auto-développée. Selon. Selon Jiang Jie, vice-président du groupe Tencent, Tencent Hunyuan Large Model a été formé à partir de zéro à partir du premier jeton et maîtrise la technologie auto-développée à lien complet, des algorithmes de modèle aux cadres d'apprentissage automatique en passant par l'infrastructure d'IA. "Jiang Jie, vice-président du groupe Tencent" réaliser une nouvelle percée dans la capacité de compréhension chinoise.
À l'heure actuelle, l'application des grands modèles dans l'industrie est encore limitée dans les scènes, se concentrant principalement sur les scènes de loisirs avec une tolérance aux pannes élevée et des tâches simples. Tencent a mené une série d'innovations d'auto-recherche au niveau des algorithmes pour améliorer la fiabilité et la maturité des modèles.
En réponse au problème selon lequel les grands modèles sont sujets au « charabia », Tencent a optimisé l'algorithme et la stratégie de pré-formation, réduisant l'illusion des grands modèles Hunyuan de 30 % à 50 % par rapport à l'open source grand public. grands modèles ; grâce au renforcement La méthode d'apprentissage permet au modèle d'apprendre à identifier les problèmes de piège ; grâce à l'optimisation du codage de position, l'effet de traitement et les performances des documents très longs sont proposés pour permettre aux grands modèles de raisonner et de fonctionner ; prendre des décisions basées sur des scénarios d'application réels comme les humains.
De plus, Tencent a également développé son propre framework d'apprentissage automatique Angel, qui augmente la vitesse de formation de 1 fois et la vitesse d'inférence de 1,3 fois par rapport aux frameworks traditionnels du secteur.
Tencent Hunyuan grand modèle d'auto-recherche à lien complet
Grâce à la technologie d'auto-recherche à lien complet, le grand modèle Tencent Hunyuan peut comprendre la signification du contexte et a une longue capacité de mémoire de texte, peut mener en douceur plusieurs séries de conversations dans le domaine professionnel. En outre, il peut également créer du contenu tel que de la création littéraire, des résumés de texte et des jeux de rôle pour bien comprendre les intentions des utilisateurs et fournir des réponses rapides, efficaces et précises.Dans le test de conformité standard des « Méthodes d'évaluation pour la technologie et les applications des modèles de pré-formation à grande échelle » de l'Académie chinoise des technologies de l'information et des communications, le grand modèle Hunyuan a évalué un total de 66 éléments de capacité, en « Développement de modèle" et "Capacité du modèle" "L'évaluation complète dans deux domaines importants a obtenu le score actuel le plus élevé. Dans les ensembles d'évaluation traditionnels MMLU, CEval et AGI-eval, le grand modèle Hunyuan a d'excellentes performances, en particulier dans les sciences chinoises, les questions d'examen d'entrée à l'université, les mathématiques et d'autres sous-éléments
.
Liu Yuanchun, président de l'Université de finance et d'économie de Shanghai, estime : « Grâce à l'auto-recherche complète, la Chine continuera d'accumuler des talents et des technologies liés aux grands modèles, formera progressivement une chaîne industrielle systématique, une chaîne de talents. , la chaîne technologique et la chaîne d'innovation, et enfin créer la voie de la Chine vers le développement de l'intelligence artificielle générale nous aideront à réaliser des percées dans l'innovation technologique numérique. "
Jiang Jie a déclaré : « Nous développons de grands modèles. L'objectif n'est pas d'obtenir des scores élevés lors de l'évaluation, mais d'appliquer la technologie à des scénarios réels. »
Lors de cette conférence, Jiang Jie a montré des conférences et des documents Tencent. , Tencent Advertising et d'autres entreprises, la situation réelle des applications après avoir accédé au grand modèle Tencent Hunyuan.
Par exemple, Tencent Conference a créé un assistant IA basé sur le grand modèle Hunyuan. Il n'a besoin que d'instructions simples en langage naturel pour effectuer des tâches complexes telles que l'extraction d'informations de réunion et l'analyse de contenu, et peut également générer des comptes rendus récapitulatifs intelligents. après la réunion. Selon les mesures réelles, le grand modèle Hunyuan a atteint un taux d'adoption élevé par les utilisateurs dans de nombreux aspects tels que la compréhension des instructions, les questions et réponses en réunion, les résumés de réunion et les tâches à effectuer lors des réunions.
Application de Tencent Hunyuan Large Model dans les conférences Tencent
En termes de traitement de documents, Tencent Hunyuan Large Model prend en charge des dizaines de scénarios de création de texte, et la fonction d'assistant intelligent lancée dans Tencent Documents a été appliqué dans. Dans le même temps, Hunyuan peut également générer du texte au format standard en un seul clic, maîtrise des centaines de formules Excel, prend en charge les fonctions de génération de langage naturel et génère des graphiques basés sur le contenu des tableaux. Ces fonctions sont actuellement en phase de test interne et le seront. ouvert aux utilisateurs à maturité.
Dans le scénario commercial de la publicité, le grand modèle Tencent Hunyuan soutient la création de supports publicitaires intelligents, qui peuvent s'adapter aux caractéristiques industrielles et régionales, répondre aux besoins de milliers de personnes et réaliser l'intégration naturelle du texte et des images. , et des vidéos. En outre, sur la base des capacités du grand modèle Hunyuan, la publicité de guides d'achat intelligents peut aider les commerçants à améliorer la qualité et l'efficacité du service dans des scénarios tels que WeChat d'entreprise.
Application du grand modèle Tencent Hunyuan dans la publicité Tencent
Il est entendu qu'en juin de cette année, Tencent Cloud a lancé une solution de modèle en tant que service (MaaS), fournissant une couverture du modèle pré- formation, services de grands modèles industriels à guichet unique tels que le réglage fin du modèle et le développement d'applications intelligentes.
Récemment, Tencent Cloud s'est également entièrement intégré à plus de 20 modèles grand public tels que Llama 2 et Bloom, comme Hunyuan, ils prennent tous en charge les appels de déploiement direct. Les clients peuvent créer leurs propres modèles industriels exclusifs basés sur Hunyuan ou des modèles open source basés sur les besoins réels.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!