Inhaltsverzeichnis
Forschungsdetails
Experimentelles Verfahren
Heim Technologie-Peripheriegeräte KI Wird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer

Wird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer

Apr 08, 2023 am 10:21 AM
ai 数据

Unerwarteterweise sind die Menschen, die beim Training der KI helfen, die erste Gruppe von Menschen, die nach der Entwicklung der KI eliminiert werden.

Viele NLP-Anwendungen erfordern die manuelle Annotation großer Datenmengen für verschiedene Aufgaben, insbesondere für das Training von Klassifikatoren oder die Bewertung der Leistung unbeaufsichtigter Modelle. Je nach Umfang und Komplexität können diese Aufgaben von Crowdsourcing-Mitarbeitern auf Plattformen wie MTurk sowie von geschulten Annotatoren wie Forschungsassistenten durchgeführt werden.

Wir wissen, dass große Sprachmodelle (LLM) ab einem bestimmten Maßstab „entstehen“ können – das heißt, sie können neue Fähigkeiten erwerben, die zuvor unvorhergesehen waren. Als großes Modell, das einen neuen Ausbruch der KI fördert, haben die Fähigkeiten von ChatGPT bei vielen Aufgaben die Erwartungen der Menschen übertroffen, einschließlich der Kennzeichnung von Datensätzen und der Selbstschulung.

Kürzlich haben Forscher der Universität Zürich gezeigt, dass ChatGPT Crowdsourcing-Arbeitsplattformen und menschliche Arbeitsassistenten bei mehreren Annotationsaufgaben, einschließlich Relevanz-, Haltungs-, Themen- und Frame-Erkennung, übertrifft.

Darüber hinaus haben die Forscher nachgerechnet: ChatGPT kostet weniger als 0,003 US-Dollar pro Anmerkung – etwa 20-mal günstiger als MTurk. Diese Ergebnisse zeigen das Potenzial großer Sprachmodelle, die Effizienz der Textklassifizierung erheblich zu verbessern.

Wird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer

Link zum Papier:​https://arxiv.org/abs/2303.15056​

Forschungsdetails

Viele NLP-Anwendungen erfordern qualitativ hochwertige annotierte Daten, insbesondere für das Training von Klassifizierungsprozessoren oder zur Auswertung die Leistung unbeaufsichtigter Modelle. Beispielsweise müssen Forscher manchmal verrauschte Social-Media-Daten nach Relevanz filtern, Texte verschiedenen Themen- oder Konzeptkategorien zuordnen oder ihre emotionale Haltung messen. Unabhängig von der spezifischen Methode, die für diese Aufgaben verwendet wird (überwachtes, halbüberwachtes oder unüberwachtes Lernen), sind genau gekennzeichnete Daten erforderlich, um einen Trainingssatz zu erstellen oder ihn als Goldstandard zur Leistungsbewertung zu verwenden.

Der übliche Weg, damit umzugehen, besteht darin, wissenschaftliche Mitarbeiter einzustellen oder Crowdsourcing-Plattformen wie MTurk zu nutzen. Als OpenAI ChatGPT entwickelte, vergab es auch das Problem negativer Inhalte an eine Datenanmerkungsagentur in Kenia und führte vor der offiziellen Einführung zahlreiche Anmerkungsschulungen durch.

Dieser von der Universität Zürich in der Schweiz vorgelegte Bericht untersucht das Potenzial großer Sprachmodelle (LLM) in Textannotationsaufgaben, mit Schwerpunkt auf ChatGPT, veröffentlicht im November 2022. Es beweist, dass ChatGPT Zero-Shot (d. h. ohne zusätzliche Schulung) die MTurk-Annotation bei Klassifizierungsaufgaben übertrifft und nur ein paar Zehntel der Kosten manueller Arbeit beträgt.

Die Forscher verwendeten eine Stichprobe von 2.382 Tweets, die in einer früheren Studie gesammelt wurden. Die Tweets wurden von geschulten Annotatoren (wissenschaftlichen Mitarbeitern) für fünf verschiedene Aufgaben gekennzeichnet: Relevanz, Haltung, Thema und Zwei-Frame-Erkennung. Im Experiment übergab der Forscher die Aufgabe an ChatGPT als Zero-Shot-Klassifizierung und gleichzeitig an die Crowdsourcing-Mitarbeiter auf MTurk und bewertete dann die Leistung von ChatGPT anhand von zwei Benchmarks: relativ zur Genauigkeit menschlicher Mitarbeiter auf der Crowdsourcing-Plattform, und Genauigkeit im Vergleich zu wissenschaftlichen Hilfskommentatoren.

Es wurde festgestellt, dass die Zero-Sample-Genauigkeit von ChatGPT bei vier von fünf Aufgaben höher war als die von MTurk. Bei allen Aufgaben übertrifft die Encodervereinbarung von ChatGPT die von MTurk und geschulten Kommentatoren. Darüber hinaus ist ChatGPT hinsichtlich der Kosten viel günstiger als MTurk: Fünf Klassifizierungsaufgaben kosten bei ChatGPT etwa 68 US-Dollar (25264 Anmerkungen) und bei MTurk etwa 657 US-Dollar (12632 Anmerkungen).

Die Kosten pro Anmerkung bei ChatGPT betragen also etwa 0,003 US-Dollar oder ein Drittel eines Cents – etwa 20-mal günstiger als bei MTurk und von höherer Qualität. Vor diesem Hintergrund ist es nun möglich, mehr Beispiele zu kommentieren oder große Trainingssätze für überwachtes Lernen zu erstellen. Basierend auf vorhandenen Tests kosten 100.000 Anmerkungen etwa 300 US-Dollar.

Während weitere Forschung erforderlich ist, um besser zu verstehen, wie ChatGPT und andere LLMs in einem breiteren Kontext funktionieren, deuten diese Ergebnisse darauf hin, dass sie das Potenzial haben, die Art und Weise, wie Forscher Daten annotieren, zu verändern und MTurk zu stören, sagen die Forscher einige Geschäftsmodelle anderer Plattformen .

Experimentelles Verfahren

Die Forscher verwendeten einen Datensatz von 2382 Tweets, die aus früheren Studien zu Aufgaben im Zusammenhang mit der Inhaltsmoderation manuell mit Anmerkungen versehen wurden. Konkret erstellten geschulte Annotatoren (wissenschaftliche Mitarbeiter) Goldstandards für fünf konzeptionelle Kategorien mit unterschiedlicher Anzahl von Kategorien: Relevanz von Tweets für Fragen der Inhaltsmoderation (relevant/irrelevant); in Bezug auf Artikel 230 (Position als Teil des U.S. Communications Decency Act von 1996). , ein wichtiger Teil der US-amerikanischen Internetgesetzgebung; Themenidentifizierung (sechs Kategorien); Rahmenwerke der Gruppe 1 (Inhaltsmoderation als Problem, Lösung oder neutral);

Die Forscher führten dann genau dieselben Klassifizierungen mithilfe von ChatGPT und Crowdsourcing-Arbeitern durch, die auf MTurk rekrutiert wurden. Für ChatGPT wurden vier Anmerkungssätze erstellt. Um die Auswirkungen des ChatGPT-Temperaturparameters zu untersuchen, der den Grad der Zufälligkeit in der Ausgabe steuert, wird er hier mit den Standardwerten 1 und 0,2 annotiert, was eine geringere Zufälligkeit impliziert. Für jeden Temperaturwert führten die Forscher zwei Annotationssätze durch, um die Encoder-Übereinstimmung von ChatGPT zu berechnen.

Für die Experten ergab die Studie, dass zwei Doktoranden der Politikwissenschaft Tweets für alle fünf Aufgaben kommentierten. Für jede Aufgabe erhielten die Programmierer die gleichen Anweisungen und wurden gebeten, Tweets von Aufgabe zu Aufgabe unabhängig zu kommentieren. Um die Genauigkeit von ChatGPT und MTurk zu berechnen, wurden beim Vergleich nur Tweets berücksichtigt, denen beide geschulten Kommentatoren zustimmten.

Für MTurk besteht das Ziel der Forschung darin, die beste Gruppe von Arbeitnehmern auszuwählen, insbesondere durch die Überprüfung von Arbeitnehmern, die von Amazon als „MTurk Masters“ eingestuft werden, mehr als 90 % positive Bewertungen haben und in den Vereinigten Staaten ansässig sind .

Diese Studie verwendet die „gpt-3.5-turbo“-Version der ChatGPT-API, um Tweets zu klassifizieren. Die Kommentierung erfolgte zwischen dem 9. März und dem 20. März 2023. Für jede Anmerkungsaufgabe haben die Forscher bewusst darauf verzichtet, ChatGPT-spezifische Aufforderungen wie „Lass uns Schritt für Schritt denken“ hinzuzufügen, um die Vergleichbarkeit zwischen ChatGPT- und MTurk-Crowdworkern sicherzustellen.

Nachdem wir mehrere Varianten getestet hatten, beschlossen die Leute, Tweets einzeln an ChatGPT zu senden, indem sie eine Eingabeaufforderung wie diese verwendeten: „Dies ist der Tweet, den ich ausgewählt habe. Markieren Sie ihn bitte mit [aufgabenspezifischen Anweisungen (z. B. Eines der Themen im Beschreibung)] Darüber hinaus wurden für jeden Tweet in dieser Studie vier ChatGPT-Antworten gesammelt und für jeden Tweet eine neue Chat-Sitzung erstellt, um sicherzustellen, dass die ChatGPT-Ergebnisse nicht durch den Anmerkungsverlauf beeinflusst wurden

Abbildung 1. ChatGPT-Zero-Shot-Textannotationsfunktionen im Vergleich zu Annotatoren mit hoher Punktzahl auf MTurk. Die Genauigkeit von ChatGPT ist in vier von fünf Aufgaben besser als bei MTurk In der obigen Abbildung hat ChatGPT in einem Fall (Relevanz) einen leichten Vorteil, in den anderen drei Fällen (Frames I, Frames II und Stance) ist die Leistung jedoch sehr ähnlich. ChatGPT schneidet 2,2- bis 3,4-mal besser ab als MTurk. Angesichts der Schwierigkeit der Aufgabe, der Anzahl der Klassen und der Tatsache, dass es sich bei den Anmerkungen um Nullstichproben handelt, ist die Genauigkeit von ChatGPT im Allgemeinen für die Korrelation mehr als ausreichend. Mit zwei Kategorien (relevant/irrelevant) verfügt ChatGPT über eine Die Genauigkeit liegt bei 72,8 %, bei drei Kategorien (positiv/negativ/neutral) beträgt die Genauigkeit 78,7 %, wenn die Anzahl der Kategorien abnimmt, obwohl auch die intrinsische Schwierigkeit der Aufgabe eine Rolle spielt Protokoll, Abbildung 1 zeigt, dass die Leistung von ChatGPT sehr hoch ist und die Leistung bei allen Aufgaben 95 % übersteigt, wenn der Temperaturparameter auf 0,2 eingestellt ist. Einschließlich geschulter Annotatoren ist die Beziehung zwischen den Codern höher und die Genauigkeit ist positiv, selbst wenn der Standardtemperaturwert 1 verwendet wird (was mehr Zufälligkeit impliziert). Obwohl die Korrelation nur auf fünf Datenpunkten basiert, deutet sie auf niedrigere Temperaturwerte hin ​möglicherweise besser für die Anmerkungsaufgabe geeignet, da es die Konsistenz der Ergebnisse zu verbessern scheint, ohne die Genauigkeit drastisch zu verringern. Darüber hinaus muss betont werden, dass das Testen von ChatGPT ein komplexes Thema ist. Forscher haben konzeptionelle Kategorien für bestimmte Forschungszwecke entwickelt. Einige Aufgaben umfassen eine große Anzahl von Kategorien, dennoch erreicht ChatGPT immer noch eine hohe Genauigkeit Wird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer

.

Die Verwendung von Modellen zur Annotation von Daten ist nichts Neues. In der Informatikforschung, die große Datensätze verwendet, beschriften Menschen oft eine kleine Anzahl von Proben und erweitern sie dann durch maschinelles Lernen. Nachdem wir jedoch den Menschen übertroffen haben, können wir den Urteilen von ChatGPT in Zukunft möglicherweise mehr vertrauen.

Das obige ist der detaillierte Inhalt vonWird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Laravels Geospatial: Optimierung interaktiver Karten und großen Datenmengen Laravels Geospatial: Optimierung interaktiver Karten und großen Datenmengen Apr 08, 2025 pm 12:24 PM

Verarbeiten Sie 7 Millionen Aufzeichnungen effizient und erstellen Sie interaktive Karten mit Geospatial -Technologie. In diesem Artikel wird untersucht, wie über 7 Millionen Datensätze mithilfe von Laravel und MySQL effizient verarbeitet und in interaktive Kartenvisualisierungen umgewandelt werden können. Erstes Herausforderungsprojektanforderungen: Mit 7 Millionen Datensätzen in der MySQL -Datenbank wertvolle Erkenntnisse extrahieren. Viele Menschen erwägen zunächst Programmiersprachen, aber ignorieren die Datenbank selbst: Kann sie den Anforderungen erfüllen? Ist Datenmigration oder strukturelle Anpassung erforderlich? Kann MySQL einer so großen Datenbelastung standhalten? Voranalyse: Schlüsselfilter und Eigenschaften müssen identifiziert werden. Nach der Analyse wurde festgestellt, dass nur wenige Attribute mit der Lösung zusammenhängen. Wir haben die Machbarkeit des Filters überprüft und einige Einschränkungen festgelegt, um die Suche zu optimieren. Kartensuche basierend auf der Stadt

Wie man MySQL löst, kann nicht gestartet werden Wie man MySQL löst, kann nicht gestartet werden Apr 08, 2025 pm 02:21 PM

Es gibt viele Gründe, warum MySQL Startup fehlschlägt und durch Überprüfung des Fehlerprotokolls diagnostiziert werden kann. Zu den allgemeinen Ursachen gehören Portkonflikte (prüfen Portbelegung und Änderung der Konfiguration), Berechtigungsprobleme (Überprüfen Sie den Dienst Ausführen von Benutzerberechtigungen), Konfigurationsdateifehler (Überprüfung der Parametereinstellungen), Datenverzeichniskorruption (Wiederherstellung von Daten oder Wiederaufbautabellenraum), InnoDB-Tabellenraumprobleme (prüfen IBDATA1-Dateien), Plug-in-Ladeversagen (Überprüfen Sie Fehlerprotokolle). Wenn Sie Probleme lösen, sollten Sie sie anhand des Fehlerprotokolls analysieren, die Hauptursache des Problems finden und die Gewohnheit entwickeln, Daten regelmäßig zu unterstützen, um Probleme zu verhindern und zu lösen.

So verwenden Sie MySQL nach der Installation So verwenden Sie MySQL nach der Installation Apr 08, 2025 am 11:48 AM

Der Artikel führt den Betrieb der MySQL -Datenbank vor. Zunächst müssen Sie einen MySQL -Client wie MySQLworkBench oder Befehlszeilen -Client installieren. 1. Verwenden Sie den Befehl mySQL-uroot-P, um eine Verbindung zum Server herzustellen und sich mit dem Stammkonto-Passwort anzumelden. 2. Verwenden Sie die Erstellung von Createdatabase, um eine Datenbank zu erstellen, und verwenden Sie eine Datenbank aus. 3.. Verwenden Sie CreateTable, um eine Tabelle zu erstellen, Felder und Datentypen zu definieren. 4. Verwenden Sie InsertInto, um Daten einzulegen, Daten abzufragen, Daten nach Aktualisierung zu aktualisieren und Daten nach Löschen zu löschen. Nur indem Sie diese Schritte beherrschen, lernen, mit gemeinsamen Problemen umzugehen und die Datenbankleistung zu optimieren, können Sie MySQL effizient verwenden.

Verstehen von Säureeigenschaften: Die Säulen einer zuverlässigen Datenbank Verstehen von Säureeigenschaften: Die Säulen einer zuverlässigen Datenbank Apr 08, 2025 pm 06:33 PM

Detaillierte Erläuterung von Datenbanksäureattributen Säureattribute sind eine Reihe von Regeln, um die Zuverlässigkeit und Konsistenz von Datenbanktransaktionen sicherzustellen. Sie definieren, wie Datenbanksysteme Transaktionen umgehen, und sorgen dafür, dass die Datenintegrität und -genauigkeit auch im Falle von Systemabstürzen, Leistungsunterbrechungen oder mehreren Benutzern gleichzeitiger Zugriff. Säureattributübersicht Atomizität: Eine Transaktion wird als unteilbare Einheit angesehen. Jeder Teil schlägt fehl, die gesamte Transaktion wird zurückgerollt und die Datenbank behält keine Änderungen bei. Wenn beispielsweise eine Banküberweisung von einem Konto abgezogen wird, jedoch nicht auf ein anderes erhöht wird, wird der gesamte Betrieb widerrufen. begintransaktion; updateAccountsSetBalance = Balance-100WH

Remote Senior Backend Engineers (Plattformen) benötigen Kreise Remote Senior Backend Engineers (Plattformen) benötigen Kreise Apr 08, 2025 pm 12:27 PM

Remote Senior Backend Engineer Job Vacant Company: Circle Standort: Remote-Büro-Jobtyp: Vollzeitgehalt: 130.000 bis 140.000 US-Dollar Stellenbeschreibung Nehmen Sie an der Forschung und Entwicklung von Mobilfunkanwendungen und öffentlichen API-bezogenen Funktionen, die den gesamten Lebenszyklus der Softwareentwicklung abdecken. Die Hauptaufgaben erledigen die Entwicklungsarbeit unabhängig von RubyonRails und arbeiten mit dem Front-End-Team von React/Redux/Relay zusammen. Erstellen Sie die Kernfunktionalität und -verbesserungen für Webanwendungen und arbeiten Sie eng mit Designer und Führung während des gesamten funktionalen Designprozesses zusammen. Fördern Sie positive Entwicklungsprozesse und priorisieren Sie die Iterationsgeschwindigkeit. Erfordert mehr als 6 Jahre komplexes Backend für Webanwendungen

Kann MySQL JSON zurückgeben? Kann MySQL JSON zurückgeben? Apr 08, 2025 pm 03:09 PM

MySQL kann JSON -Daten zurückgeben. Die JSON_EXTRACT -Funktion extrahiert Feldwerte. Über komplexe Abfragen sollten Sie die Where -Klausel verwenden, um JSON -Daten zu filtern, aber auf die Leistungsauswirkungen achten. Die Unterstützung von MySQL für JSON nimmt ständig zu, und es wird empfohlen, auf die neuesten Versionen und Funktionen zu achten.

MySQL kann nach dem Herunterladen nicht installiert werden MySQL kann nach dem Herunterladen nicht installiert werden Apr 08, 2025 am 11:24 AM

Die Hauptgründe für den Fehler bei MySQL -Installationsfehlern sind: 1. Erlaubnisprobleme, Sie müssen als Administrator ausgeführt oder den Sudo -Befehl verwenden. 2. Die Abhängigkeiten fehlen, und Sie müssen relevante Entwicklungspakete installieren. 3. Portkonflikte müssen Sie das Programm schließen, das Port 3306 einnimmt, oder die Konfigurationsdatei ändern. 4. Das Installationspaket ist beschädigt. Sie müssen die Integrität herunterladen und überprüfen. 5. Die Umgebungsvariable ist falsch konfiguriert und die Umgebungsvariablen müssen korrekt entsprechend dem Betriebssystem konfiguriert werden. Lösen Sie diese Probleme und überprüfen Sie jeden Schritt sorgfältig, um MySQL erfolgreich zu installieren.

Lösungen für den Dienst, der nach der MySQL -Installation nicht gestartet werden kann Lösungen für den Dienst, der nach der MySQL -Installation nicht gestartet werden kann Apr 08, 2025 am 11:18 AM

MySQL hat sich geweigert, anzufangen? Nicht in Panik, lass es uns ausprobieren! Viele Freunde stellten fest, dass der Service nach der Installation von MySQL nicht begonnen werden konnte, und sie waren so ängstlich! Mach dir keine Sorgen, dieser Artikel wird dich dazu bringen, ruhig damit umzugehen und den Mastermind dahinter herauszufinden! Nachdem Sie es gelesen haben, können Sie dieses Problem nicht nur lösen, sondern auch Ihr Verständnis von MySQL -Diensten und Ihren Ideen zur Fehlerbehebungsproblemen verbessern und zu einem leistungsstärkeren Datenbankadministrator werden! Der MySQL -Dienst startete nicht und es gibt viele Gründe, von einfachen Konfigurationsfehlern bis hin zu komplexen Systemproblemen. Beginnen wir mit den häufigsten Aspekten. Grundkenntnisse: Eine kurze Beschreibung des Service -Startup -Prozesses MySQL Service Startup. Einfach ausgedrückt, lädt das Betriebssystem MySQL-bezogene Dateien und startet dann den MySQL-Daemon. Dies beinhaltet die Konfiguration

See all articles