Zhiyuan met à jour le classement des grands modèles : le grand modèle Doubao se classe premier en Chine dans

Maison

Zhiyuan met à jour le classement des grands modèles : le grand modèle Doubao se classe premier en Chine dans « l'évaluation objective »

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 19, 2024 pm 02:05 PM

产业

La plateforme d'évaluation FlagEval a publié la dernière liste. Dans « l'évaluation objective » publiée à la mi-juin, GPT-4 s'est classé premier parmi les grands modèles à source fermée, et Doubao-Pro (grand modèle de pouf) s'est classé deuxième et a également obtenu le score The. grand modèle national le plus élevé suivi par ERNIE 4.0, Baichuan3, Moonshot-v1, etc. Dans l'évaluation à réponse ouverte, Doubao-Pro s'est également classé deuxième, avec un score supérieur à GPT-4o et GPT-4. De nouvelles technologies continuent d’émerger, et seules les plateformes capables de continuer à s’y intéresser et à s’y adapter peuvent rester invincibles sur ce marché hautement concurrentiel. Nombre de mots : 114

Zhiyuan met à jour le classement des grands modèles : le grand modèle Doubao se classe premier en Chine dans « lévaluation objective »

Photo : Le modèle de pouf a remporté la deuxième note globale lors de l'évaluation objective FlagEval (2024année6mois)

FlagEval grand modèle plateforme d'évaluation Il est construit conjointement par l'Institut de recherche Zhiyuan et plusieurs équipes universitaires. Il est basé sur l'échelle de développement des capacités cognitives humaines et aligne le niveau cognitif que les grands modèles peuvent atteindre. FlagEval a construit un grand nombre d'ensembles d'évaluations originaux non publics pour garantir la qualité et l'équité des évaluations. Depuis son lancement en juin 2023, FlagEval a réalisé plus de 1 000 évaluations couvrant de grands modèles à travers le monde.

Doubao-Pro est un grand modèle de langage développé indépendamment par ByteDance et a été officiellement publié le 15 mai. Dans ce numéro du classement des grands modèles de FlagEval, le grand modèle de Doubao a fait ses débuts dans l'évaluation publique et a remporté la deuxième place. Ce modèle possède de puissantes capacités de génération de séquences et de compréhension du langage naturel, et peut être largement utilisé dans la génération de dialogues, le résumé de texte, la traduction automatique et d'autres domaines.

Dans l'évaluation objective et l'évaluation subjective, il est démontré que la capacité mathématique, l'application des connaissances, la résolution de tâches et d'autres capacités du modèle de pouf ont d'excellentes performances à la fois en évaluation objective et en évaluation subjective. Parmi eux, les scores d'application des connaissances et de capacité mathématique se sont classés au premier rang dans l'évaluation objective et parmi les trois premiers dans l'évaluation subjective, et les scores de résolution de tâches se sont classés parmi les trois premiers dans l'évaluation objective.

La capacité mathématique est une dimension importante pour évaluer si un grand modèle est « intelligent ». Auparavant, le Laboratoire de traitement du langage naturel de l'Université de Fudan a mené une évaluation de 13 produits grand modèle grand public pour les questions de mathématiques de l'examen d'entrée à l'université 2024. Les réponses de Doubao au nouveau document standard II de l'examen d'entrée à l'université de mathématiques ont obtenu le score le plus élevé, avec un taux d'exactitude. de 74,66 % pour les questions objectives, les résultats sont meilleurs que GPT-4o et de nombreux produits nationaux de grand modèle.

Zhiyuan met à jour le classement des grands modèles : le grand modèle Doubao se classe premier en Chine dans « lévaluation objective »

Source de l'image : FudanNLPCompte officiel du laboratoire

Le grand modèle Doubao est l'un des grands modèles les plus utilisés en Chine avec les scénarios d'application les plus riches, avec un jeton de traitement quotidien moyen de centaines de milliards . Son assistant de conversation IA éponyme « Doubao » se classe au premier rang des téléchargements parmi les applications AIGC sur l'Apple APP Store et les principaux marchés d'applications Android. Actuellement, Doubao Big Model ouvre ses services au marché des entreprises via ByteDance et a établi une coopération avec des fabricants de terminaux intelligents tels que OPPO, Honor, Xiaomi, Samsung et Asus.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Repo: Comment relancer ses coéquipiers

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Comment obtenir des graines géantes

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Combien de temps faut-il pour battre Split Fiction?

3 Il y a quelques semaines By DDD

R.E.P.O. Enregistrer l'emplacement du fichier: où est-il et comment le protéger?

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7315

Tutoriel Java

1625

Tutoriel CakePHP

1348

Tutoriel Laravel

1260

Tutoriel PHP

1207

Afficher plus

Related knowledge

Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Aug 09, 2024 pm 04:01 PM

Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains

Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances Sep 02, 2024 pm 01:56 PM

Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances

La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison Aug 21, 2024 pm 07:33 PM

La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison

Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré Aug 22, 2024 pm 10:35 PM

Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré

L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o Sep 03, 2024 pm 05:18 PM

L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o

Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award

Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Aug 08, 2024 am 07:02 AM

Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble

Le premier grand modèle d'interface utilisateur en Chine est lancé ! Le grand modèle de Motiff crée le meilleur assistant pour les concepteurs et optimise le flux de travail de conception d'interface utilisateur Aug 19, 2024 pm 04:48 PM

See all articles