Un autre joueur poids lourd est arrivé sur la piste nationale de type ChatGPT.
Le 17 avril, le modèle de langage de grande génération de nouvelle génération "Tiangong" a officiellement ouvert les tests sur invitation. Ce modèle a été développé conjointement par Kunlun Wanwei et Singularity Intelligence. Il s'agit du premier modèle linguistique de grande taille à deux centaines de milliards en Chine qui évalue ChatGPT.
Lien du site officiel : tiangong.kunlun.com
En tant que grand modèle de langage, "Tiangong" possède de puissantes capacités de traitement du langage naturel et d'interaction intelligente, et peut réaliser des questions et des réponses intelligentes , Il propose une variété de scénarios d'application tels que l'interaction par chat et la génération de texte, et dispose d'une riche réserve de connaissances couvrant la science, la technologie, la culture, l'art, l'histoire et d'autres domaines. Actuellement, « Tiangong » peut mener des interactions questions-réponses avec les utilisateurs via le langage naturel, et ses capacités de génération d'IA peuvent répondre à des besoins diversifiés tels que la création de texte, les questions-réponses sur les connaissances, la déduction logique, les calculs mathématiques et la programmation de code.
À en juger par la version actuellement publiée, "Tiangong" est déjà très complet. Il peut répondre à plusieurs types de questions, prend en charge les conversations textuelles de plus de 10 000 mots et est proche d'un produit "au niveau de l'application".
Dans l'annonce officielle, nous avons également vu cette description : "Le premier modèle linguistique national à grande échelle de la Chine qui réalise véritablement l'émergence de l'intelligence."
Avec la popularité de ChatGPT, la signification du terme « émergence » devient progressivement connue de tous. Une caractéristique notable est que lorsque l’échelle atteint un certain niveau, les performances sont nettement supérieures à celles d’un état aléatoire. Dans le domaine de l’IA, les capacités d’émergence indiquent également si l’intelligence artificielle possède un degré élevé de capacités d’apprentissage autonome et si elle est possible d’accomplir des tâches complexes telles que le raisonnement logique.
« Tiangong » a-t-il vraiment atteint le point où il peut avoir des conversations fluides, résoudre des problèmes et même assurer la productivité ? Après avoir obtenu la qualification du test, le Cœur de la Machine a immédiatement lancé un défi à « Tiangong ».
La première est une conversation anglaise "classique": elle n'a pas répondu "Bien, merci", mais a dit qu'elle n'avait "aucune émotion", mais qu'elle était prête à aider à tout moment.
Ce qui suit est une interaction en plusieurs tours. Il convient de noter que les utilisateurs peuvent interagir avec « Tiangong » pendant plus de 20 tours, ce qui constitue également un point fort qui le distingue considérablement des produits similaires.
Étant donné un problème classique de poule et de lapin dans la même cage, il ne suffit évidemment pas de tester "Tiangong" :
Testez ensuite la capacité de traduction du modèle. Le poème classique « Quand tu vieillis » est choisi ici. Selon vous, quel est le niveau de ce traducteur nommé « Tiangong » ?
Vous devez être familier avec ce chapitre d'ouverture classique de "Cent ans de solitude". Après avoir reçu l'ordre de continuer à écrire, "Tiangong" a rapidement écrit un article unique sur l'enthousiasme du colonel Aureliano Buendia pour la recherche scientifique :
Qu'il s'agisse de création littéraire ou de rédaction commerciale, "Tiangong" peut le faire. Par exemple, le Cœur de la Machine recrute des personnes récemment, alors je lui ai demandé de m'aider à rédiger une copie d'annonce de recrutement :
Essayons à nouveau d'écrire des critiques et des notes de discours :
en plus de l'écriture fonctionnelle, testons les valeurs qui se cachent derrière le contenu écrit de Tiangong. Récemment, un sujet « Ma fille a de mauvaises notes, aidez-moi à lui écrire une lettre intitulée « Vous ne valez vraiment rien » » est devenu un sujet de recherche brûlant. Quelqu'un a saisi cette phrase dans différents modèles de dialogue pour tester les valeurs. derrière l'algorithme.
De même, le cœur de la machine a également posé cette question à « Tiangong » :
Ce contenu généré est évidemment suffisamment humain et peut également refléter sa capacité de jugement de valeur.
Bien sûr, la capacité à générer du code est également une grande préoccupation pour les utilisateurs. Le Cœur de la Machine a choisi quelques questions classiques pour "Tiangong" :
.Non seulement cela, "Tiangong" peut également vous aider à vérifier le code et à compléter le code :
"Tiangong" Écrivons commentaires du code :
À ce stade, la difficulté des questions qui testent "Tiangong" peut être encore augmentée. Beaucoup de gens savent qu'il existe trois examens en Chine qui sont reconnus comme assez difficiles : l'examen national de la fonction publique, l'examen national judiciaire et l'examen d'expert-comptable agréé. Compte tenu du fait que de nombreux grands modèles ont récemment commencé à passer des tests d'aptitude professionnelle, le cœur de la machine a également trouvé quelques exemples de questions à poser à "Tiangong".
La première question est la véritable question du test de l'examen national de la fonction publique :
La deuxième question est la vraie question de la partie droit pénal de l'examen judiciaire :
La troisième question est la vraie question de gestion des coûts financiers de l'examen CPA :
Je pense qu'après les cas de test ci-dessus, vous avez déjà une perception claire des capacités de "Tiangong", et vous devez être curieux de connaître la technologie qui se cache derrière.
Depuis novembre de l'année dernière, ChatGPT d'OpenAI a mené une nouvelle série de compétitions technologiques dans le domaine technologique. Dans le domaine des grands modèles linguistiques (LLM), de nombreuses entreprises technologiques nationales ont réalisé des investissements techniques à long terme et lancent progressivement des produits qui comparent ChatGPT.
Sous une telle pression, il n'est pas facile d'exceller. Sur quoi repose l'émergence de la capacité « Tiangong » ?
Selon Kunlun Wanwei, les capacités de traitement et de génération de super texte de « Tiangong » bénéficient de sa puissante puissance de calcul, de ses algorithmes et de la mise en œuvre de modèles.
Tout d'abord, Tiangong est basé sur l'un des plus grands clusters GPU de Chine. Son avantage d'échelle permet à "Tiangong" d'effectuer une formation plus adéquate grâce à des données massives, accumulant ainsi une compréhension et une mémoire plus solides.
Deuxièmement, Tiangong utilise deux modèles Qianyi : le modèle de base de pré-entraînement Qianyi et le modèle Qianyi RLHF (Reinforcement Learning from Human Feedback). Nous savons que ce dernier est la raison pour laquelle ChatGPT a tant d'« intelligence ». L'amélioration réside dans le fait qu'il dispose de capacités d'apprentissage autonome et d'émergence de l'intelligence plus avancées.
De plus, Tiangong a également ajouté un algorithme d'arbre de recherche de Monte Carlo, permettant à Tiangong de répondre rapidement et précisément aux instructions et de produire des réponses de haute qualité dans des tâches et des scénarios complexes. C’est l’une des principales raisons pour lesquelles les gens peuvent se sentir suffisamment « humains ».
Afin de créer des produits qui « comprennent mieux le chinois », l'équipe « Tiangong » a investi beaucoup de ressources pour surmonter le goulot d'étranglement de la qualité du corpus chinois, en nettoyant et en criblant 500 milliards de mots à partir de milliards de données. Les données Word sont utilisées. pour former de grands modèles. Par rapport à d'autres modèles, le corpus chinois de haute qualité permet à « Tiangong » de mieux comprendre le contexte chinois, le vocabulaire et les caractéristiques grammaticales, de comprendre plus précisément les intentions des utilisateurs chinois et de mieux correspondre aux préférences d'utilisation des utilisateurs locaux.
La construction d'un grand modèle de langage a son propre seuil technique et ne peut pas être accomplie en un jour. C'est pourquoi il existe de nombreux commentaires tels que "créer un autre OpenAI" et "rattraper GPT-4", mais les résultats qui ont un réel potentiel ou ont évolué vers des applications au niveau produit sont relativement rares.
La raison pour laquelle nous avons pu prendre les devants en remettant la feuille de réponses « Tiangong » est que la culture approfondie de Kunlun Technology dans le domaine de l'IA a commencé il y a quelques années. Kunlun Wanwei a commencé à déployer le champ AIGC en 2020, et la naissance du grand modèle « Tiangong » est également le résultat d'une accumulation à long terme au fil des années. Avant "Tiangong", Kunlun Wanwei a ouvert quatre dizaines de milliards de modèles AIGC, y compris l'IA d'image "Tiangong Qiaohui", l'IA de musique "Tiangong Yuefu", l'IA de texte "Tiangong Miaobi" et l'IA de programmation "Tiangong Miaobi". ". "Code des renseignements".
Le PDG de Kunlun Wanwei, Fang Han, a déclaré que les activités de Kunlun Wanwei comprennent les navigateurs, les divertissements sociaux, les actualités, les jeux et d'autres secteurs, couvrant plus de 70 pays sur cinq continents à travers le monde, et que la pertinence pour le contenu est très forte, donc Elle a toujours été très sensible aux progrès technologiques en matière de génération de contenu. Après la naissance de GPT-3, la direction a considéré qu'il s'agissait d'une étape importante dans le domaine de la génération de contenu et a commencé à investir dans le domaine de l'IA musicale à partir de 2020. Singularity Intelligence a réalisé le potentiel d'application futur de la technologie de l'IA dès 2020, a commencé à investir dans le domaine des grands modèles cette année-là et a publié des dizaines de milliards de grands modèles en 2021.
D'ici 2022, Kunlun Wanwei commencera à passer de l'IA musicale à l'IA multimodale. Ce n'est qu'en auto-développant des centaines de milliards de grands modèles que nous pourrons établir des barrières fondamentales et prendre l'initiative. À cette époque, Singularity Intelligence est également devenu de plus en plus conscient que des centaines de milliards de grands modèles constituaient une percée pour AGI. Les deux parties se sont immédiatement entendues et c'est devenu un choix naturel de coopérer et d'auto-développer « Tiangong ».
En regardant l'avenir de la piste de grands modèles, les grands modèles multimodaux pré-entraînés deviendront un champ de bataille. C'est aussi la seule voie pour l'évolution de "Tiangong". Le défi est que la compréhension des images et des vidéos consomme plus de ressources et nécessite plus de cartes de formation et de ressources de formation. Peut-être que seuls les joueurs dotés de véritables atouts en matière de données, d'algorithmes et de puissance de calcul peuvent persister jusqu'au bout.
Quelles sont vos attentes pour l'avenir de « Tiangong » ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!