Als ChatGPT an Chinas College-Aufnahmeprüfung teilnahm und ihm die nationalen A- und B-Prüfungen vorlegte, stellte sich heraus, dass es ernsthaft voreingenommen war!-KI-php.cn

Heim

Als ChatGPT an Chinas College-Aufnahmeprüfung teilnahm und ihm die nationalen A- und B-Prüfungen vorlegte, stellte sich heraus, dass es ernsthaft voreingenommen war!

王林

May 26, 2023 pm 03:37 PM

a卷偏科

xixiaoyao Technology Talk Original
Autor |. PythonChatGPT wurde nach seiner Einführung als intelligente Mensch-Maschine-Konversationsanwendung schnell auf der ganzen Welt beliebt. In nur einem Monat hat die Zahl der Nutzer 100 Millionen überschritten. Menschen verwenden ChatGPT auch, um viele Prüfungsgegenstände wie SAT, AP, GRE usw. zu testen. Wie wäre es jedoch, wenn ChatGPT an Chinas Hochschulaufnahmeprüfung teilnehmen dürfte? Wird er voreingenommen sein? Können normale Leute wie wir ChatGPT bestehen? Werfen wir einen Blick auf die Kommentare von Studenten der Fudan-Universität und der East China Normal University.

Papiertitel:
Bewertung der Leistung großer Sprachmodelle auf GAOKAO-Benchmark
Papierlink: https://www.php.cn/link/de66dbc30377a1f7908db45298324aa3# 🎜🎜#

Wie verwende ich ChatGPT, um Fragen zur Hochschulaufnahmeprüfung zu beantworten?

Dieses Dokument verwendet eine Zero-Supervised-Prompt-Methode, um Testfragen in Eingaben für ChatGPT umzuwandeln, wie in der Abbildung unten dargestellt. Für unterschiedliche Themen und Fragetypen sind unterschiedliche Untersuchungsmethoden konzipiert. Konvertieren Sie bei mathematischen Fragen die Formel in eine Latexeingabe.

Als ChatGPT an Chinas College-Aufnahmeprüfung teilnahm und ihm die nationalen A- und B-Prüfungen vorlegte, stellte sich heraus, dass es ernsthaft voreingenommen war!

Datensatz für die Hochschulaufnahmeprüfung

In diesem Artikel werden das nationale A-Papier und das nationale B-Papier von 2010 bis 2022 verwendet. Insgesamt 13 Jahre, jeder Satz von Prüfungsarbeiten umfasst 10 Fächer, nämlich Chinesisch, Mathematik, Englisch, Physik, Chemie, Leben, Geschichte und Landverwaltung. Die Mathematik ist in naturwissenschaftliche Mathematik und Geisteswissenschaften unterteilt.

Der Datensatz enthält insgesamt 2811 Testfragen. Die spezifischen Fragetypen werden hier nicht besprochen. Ich glaube, dass die Leser mit den Fragen zur Hochschulaufnahmeprüfung sehr vertraut sind.

Als ChatGPT an Chinas College-Aufnahmeprüfung teilnahm und ihm die nationalen A- und B-Prüfungen vorlegte, stellte sich heraus, dass es ernsthaft voreingenommen war!

Während der Evaluierung wurden Gymnasiallehrer der Shanghai Caoyang No. 2 Middle School engagiert, um die subjektiven Fragen zu bewerten.

Experiment und Analyse

Die von ChatGPT im Laufe der Jahre bei der Hochschulaufnahmeprüfung erzielten Ergebnisse sind in der folgenden Abbildung dargestellt. Da jedes Fach bei der Berechnung der Noten auf 100 Punkte normiert wird, kann diese Punktzahl nicht direkt mit Ihren und meinen Noten für die Hochschulaufnahmeprüfung verglichen werden. Es zeigt sich aber auch, dass diese Punktzahl nicht ideal ist und es wird geschätzt, dass weder die Fudan noch die East China Normal University zugelassen werden. Warum ist das so?

Als ChatGPT an Chinas College-Aufnahmeprüfung teilnahm und ihm die nationalen A- und B-Prüfungen vorlegte, stellte sich heraus, dass es ernsthaft voreingenommen war!

Das obige Bild zeigt die Leistung von ChatGPT in verschiedenen Themen sowie subjektiven und objektiven Themen. Blau steht für objektive Fragen und Gelb für subjektive Fragen. Die Analyse ergab, dass ChatGPT bei objektiven Fragen, insbesondere beim englischen Leseverständnis, bei Single Choice und bei Lückentexten, bessere Ergebnisse erzielte und eine Genauigkeit von 88,3 %, 78,1 % bzw. 73,8 % erreichte. Aber selbst bei objektiven Fragen liegt die Genauigkeitsrate in Naturwissenschaften und Mathematik unter 40 %. Mathematik ist wirklich schwierig ~

Die Leistung von ChatGPT bei subjektiven Fragen ist schlecht. In den Fächern Physik, Chemie, Biologie und Mathematik ist die Leistung bei subjektiven Fragen offensichtlich nicht so gut wie bei objektiven Fragen. Die Ergebnisse für objektive Fragen in naturwissenschaftlichen Fächern sind ebenfalls schlecht. Vielleicht ist ChatGPT eher auf geisteswissenschaftliche Fächer ausgerichtet? Den Kommentaren der Rezensenten zufolge sind die Hauptmängel von ChatGPT: 1. Die komplexen Gleichungen in mathematischen Problemen sind schwer richtig zu lösen, und im Problemlösungsprozess werden falsche Formeln verwendet. 2. Unzureichende Fähigkeit, beim Lesen längerer Materialien zu verstehen und zusammenzufassen.

Zusammenfassung

ChatGPT verwendet während des Schulungsprozesses möglicherweise keine Daten zu chinesischen Hochschulaufnahmeprüfungsfragen, sodass seine Leistung nicht durch Datenlecks beeinträchtigt wird und eine hohe Glaubwürdigkeit aufweist.

Beobachtungsergebnisse zeigen, dass die Leistung von ChatGPT bei chinesischen Hochschulaufnahmeprüfungsfragen im Vergleich zu ausländischen Prüfungen etwas schlechter ist. Daher müssen sich inländische Studierende vorerst keine allzu großen Sorgen darüber machen, dass sie den ChatGPT nicht bestehen. Allerdings wurden die im Artikel erwähnten Langtext-Zusammenfassungsfunktionen in GPT4-32K erheblich verbessert, und das inländische große Modell wurde auch für chinesische Daten weiter optimiert. Daher können wir in Zukunft mit einer beeindruckenderen Leistung bei Fragen zu groß angelegten Hochschulaufnahmeprüfungen rechnen.

Darüber hinaus kann die Idee, ChatGPT zur Lösung von Fragen zu Hochschulaufnahmeprüfungen zu verwenden, möglicherweise die Debatte unter Internetnutzern darüber beantworten, in welcher Provinz die Prüfungsfragen schwieriger sind?

Das obige ist der detaillierte Inhalt vonAls ChatGPT an Chinas College-Aufnahmeprüfung teilnahm und ihm die nationalen A- und B-Prüfungen vorlegte, stellte sich heraus, dass es ernsthaft voreingenommen war!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Wie lange dauert es, um Split Fiction zu schlagen?

1 Monate vor By DDD

R.E.P.O. Beste grafische Einstellungen

2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

1 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7412

CakePHP-Tutorial

1359

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

Related knowledge

Ich habe versucht, die Vibe -Codierung mit Cursor AI und es ist erstaunlich! Mar 20, 2025 pm 03:34 PM

Die Vibe -Codierung verändert die Welt der Softwareentwicklung, indem wir Anwendungen mit natürlicher Sprache anstelle von endlosen Codezeilen erstellen können. Inspiriert von Visionären wie Andrej Karpathy, lässt dieser innovative Ansatz Dev

So verwenden Sie Dall-E 3: Tipps, Beispiele und Funktionen Mar 09, 2025 pm 01:00 PM

Dall-e 3: Ein generatives KI-Bilderstellungstool Generative AI revolutioniert die Erstellung von Inhalten, und Dall-E 3, das neueste Bildgenerierungsmodell von OpenAI, steht vor der Spitze. Veröffentlicht im Oktober 2023 baut es auf seinen Vorgängern Dall-E und Dall-E 2 auf

Top 5 Genai Starts vom Februar 2025: GPT-4,5, GROK-3 & MEHR! Mar 22, 2025 am 10:58 AM

Februar 2025 war ein weiterer bahnbrechender Monat für die Generative KI, die uns einige der am meisten erwarteten Modell-Upgrades und bahnbrechenden neuen Funktionen gebracht hat. Von Xais Grok 3 und Anthropics Claude 3.7 -Sonett, um g zu eröffnen

Wie benutze ich Yolo V12 zur Objekterkennung? Mar 22, 2025 am 11:07 AM

Yolo (Sie schauen nur einmal) war ein führender Echtzeit-Objekterkennungsrahmen, wobei jede Iteration die vorherigen Versionen verbessert. Die neueste Version Yolo V12 führt Fortschritte vor, die die Genauigkeit erheblich verbessern

Elon Musk & Sam Altman kämpfen über 500 Milliarden US -Dollar Stargate -Projekt Mar 08, 2025 am 11:15 AM

Das 500 -Milliarden -Dollar -Stargate AI -Projekt, das von Tech -Giganten wie Openai, Softbank, Oracle und Nvidia unterstützt und von der US -Regierung unterstützt wird, zielt darauf ab, die amerikanische KI -Führung zu festigen. Dieses ehrgeizige Unternehmen verspricht eine Zukunft, die von AI Advanceme geprägt ist

Sora vs Veo 2: Welches erstellt realistischere Videos? Mar 10, 2025 pm 12:22 PM

Google's Veo 2 und Openais Sora: Welcher AI -Videogenerator regiert oberste? Beide Plattformen erzeugen beeindruckende KI -Videos, aber ihre Stärken liegen in verschiedenen Bereichen. Dieser Vergleich unter Verwendung verschiedener Eingabeaufforderungen zeigt, welches Werkzeug Ihren Anforderungen am besten entspricht. T

Gencast von Google: Wettervorhersage mit Gencast Mini Demo Mar 16, 2025 pm 01:46 PM

Gencast von Google Deepmind: Eine revolutionäre KI für die Wettervorhersage Die Wettervorhersage wurde einer dramatischen Transformation unterzogen, die sich von rudimentären Beobachtungen zu ausgefeilten AI-angetriebenen Vorhersagen überschreitet. Google DeepMinds Gencast, ein Bodenbrei

Welche KI ist besser als Chatgpt? Mar 18, 2025 pm 06:05 PM

Der Artikel erörtert KI -Modelle, die Chatgpt wie Lamda, Lama und Grok übertreffen und ihre Vorteile in Bezug auf Genauigkeit, Verständnis und Branchenauswirkungen hervorheben. (159 Charaktere)

See all articles