Lorsque ChatGPT a participé à l'examen d'entrée à l'université en Chine et lui a fourni les épreuves nationales A et B, cela s'est avéré sérieusement biaisé !-IA-php.cn

Table des matières

Comment laisser ChatGPT répondre aux questions de l'examen d'entrée à l'université ?

Ensemble de données sur l'examen d'entrée à l'université

Expérience et analyse

Résumé

Maison

Périphériques technologiques

Lorsque ChatGPT a participé à l'examen d'entrée à l'université en Chine et lui a fourni les épreuves nationales A et B, cela s'est avéré sérieusement biaisé !

王林

May 26, 2023 pm 03:37 PM

a卷偏科

Xi Xiaoyao Technology Talk Original
Auteur | PythonChatGPT, en tant qu'application de conversation homme-machine intelligente, est rapidement devenue populaire dans le monde entier après son lancement. En seulement un mois, son nombre d’utilisateurs a dépassé les 100 millions. Les gens utilisent également ChatGPT pour tester de nombreux éléments d'examen, tels que SAT, AP, GRE, etc. Cependant, que se passerait-il si ChatGPT était autorisé à participer à l’examen d’entrée à l’université en Chine ? Sera-t-il partial ? Les gens ordinaires comme nous peuvent-ils réussir ChatGPT ? Jetons un coup d'œil aux commentaires apportés par les étudiants de l'Université de Fudan et de l'Université normale de Chine orientale.

Titre de l'article :
Évaluer les performances des grands modèles linguistiques sur le benchmark GAOKAO
Lien de l'article :https://www.php.cn/link/de66dbc30377a1f7908db45298324aa3

Comment laisser ChatGPT répondre aux questions de l'examen d'entrée à l'université ?

Cet article utilise une méthode d'invite sans supervision pour convertir les questions de test en entrée ChatGPT, comme le montre la figure ci-dessous. Différentes méthodes d'enquête sont conçues pour différents sujets et types de questions. Pour les questions mathématiques, convertissez la formule en entrée latex.

Lorsque ChatGPT a participé à lexamen dentrée à luniversité en Chine et lui a fourni les épreuves nationales A et B, cela sest avéré sérieusement biaisé !

Ensemble de données sur l'examen d'entrée à l'université

Le test de cet article utilise l'épreuve nationale A et l'épreuve nationale B pour un total de 13 ans de 2010 à 2022. Chaque ensemble d'épreuves contient 10 matières, à savoir le chinois, Mathématiques, anglais, physique, chimie, vie, histoire et affaires foncières, parmi lesquelles les mathématiques sont divisées en mathématiques scientifiques et mathématiques des arts libéraux.

L'ensemble de données contient un total de 2811 questions de test. Les types de questions spécifiques ne seront pas abordés ici. Je pense que les lecteurs connaissent très bien les questions de l'examen d'entrée à l'université.

Lorsque ChatGPT a participé à lexamen dentrée à luniversité en Chine et lui a fourni les épreuves nationales A et B, cela sest avéré sérieusement biaisé !

Lors de l'évaluation, des professeurs du secondaire du collège Caoyang n°2 de Shanghai ont été embauchés pour noter les questions subjectives.

Expérience et analyse

Les scores obtenus par ChatGPT à l'examen d'entrée à l'université au fil des ans sont présentés dans la figure ci-dessous. Étant donné que chaque matière est normalisée à 100 points lors du calcul des scores, ce score ne peut pas être directement comparé à vos résultats et aux miens à l'examen d'entrée à l'université. Mais on voit aussi que ce score n'est pas idéal, et on estime que ni Fudan ni l'East China Normal University ne seront admis. Pourquoi est-ce ?

Lorsque ChatGPT a participé à lexamen dentrée à luniversité en Chine et lui a fourni les épreuves nationales A et B, cela sest avéré sérieusement biaisé !

L'image ci-dessus montre les performances de ChatGPT dans divers sujets, ainsi que des sujets subjectifs et objectifs. Le bleu correspond aux questions objectives et le jaune aux questions subjectives. L'analyse a révélé que ChatGPT a obtenu de meilleurs résultats sur les questions objectives, en particulier la compréhension écrite de l'anglais, le choix unique et le cloze, atteignant respectivement une précision de 88,3 %, 78,1 % et 73,8 %. Mais même pour les questions objectives, le taux de précision en sciences et en mathématiques est inférieur à 40 %. Les mathématiques sont vraiment difficiles ~

Les performances de ChatGPT sur les questions subjectives sont médiocres. Dans les matières de physique, de chimie, de biologie et de mathématiques, les performances des questions subjectives ne sont évidemment pas aussi bonnes que celles des questions objectives. Les scores aux questions objectives dans les matières scientifiques sont également médiocres. Peut-être que ChatGPT est biaisé en faveur des matières d'arts libéraux ? Selon les commentaires des évaluateurs, les principaux défauts de ChatGPT sont les suivants : 1. Les équations complexes des problèmes mathématiques sont difficiles à résoudre correctement et de mauvaises formules sont utilisées dans le processus de résolution de problèmes. 2. Capacité insuffisante à comprendre et à résumer lors de la lecture de documents plus longs.

Résumé

ChatGPT ne peut pas utiliser les données des questions de l'examen d'entrée à l'université chinoise pendant le processus de formation, ses performances ne sont donc pas affectées par les fuites de données et ont une grande crédibilité.

Les résultats d'observation montrent que par rapport aux examens étrangers, les performances de ChatGPT aux questions de l'examen d'entrée à l'université chinoise sont légèrement inférieures. Par conséquent, les étudiants nationaux n’ont pas à trop s’inquiéter de ne pas pouvoir réussir l’examen ChatGPT pour le moment. Cependant, les capacités de résumé de texte long mentionnées dans l'article ont été considérablement améliorées dans GPT4-32K, et le grand modèle national a également été optimisé davantage sur les données chinoises. Par conséquent, nous pouvons nous attendre à des performances plus impressionnantes sur les questions d’examen d’entrée à l’université à grande échelle à l’avenir.

De plus, l'idée d'utiliser ChatGPT pour résoudre les questions d'examen d'entrée à l'université pourrait peut-être répondre au débat parmi les internautes sur la question de savoir quelle province les questions d'examen sont les plus difficiles ?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Will R.E.P.O. Vous avez un jeu croisé?

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7548

Tutoriel CakePHP

1382

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Apr 02, 2025 pm 06:10 PM

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

Chatgpt 4 o est-il disponible? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

Quelle IA est la meilleure que Chatgpt? Mar 18, 2025 pm 06:05 PM

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

Assistants d'écriture de l'IA pour augmenter votre création de contenu Apr 02, 2025 pm 06:11 PM

L'article traite des meilleurs assistants d'écriture d'IA comme Grammarly, Jasper, Copy.ai, WireSonic et Rytr, en se concentrant sur leurs fonctionnalités uniques pour la création de contenu. Il soutient que Jasper excelle dans l'optimisation du référencement, tandis que les outils d'IA aident à maintenir le ton

Comment utiliser Mistral OCR pour votre prochain modèle de chiffon Mar 21, 2025 am 11:11 AM

Mistral OCR: révolutionner la génération de la récupération avec une compréhension du document multimodal Les systèmes de génération (RAG) (RAG) de la récupération ont considérablement avancé les capacités d'IA, permettant à de vastes magasins de données pour une responsabilité plus éclairée

See all articles