


Wird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer
Unerwarteterweise sind die Menschen, die beim Training der KI helfen, die erste Gruppe von Menschen, die nach der Entwicklung der KI eliminiert werden.
Viele NLP-Anwendungen erfordern die manuelle Annotation großer Datenmengen für verschiedene Aufgaben, insbesondere für das Training von Klassifikatoren oder die Bewertung der Leistung unbeaufsichtigter Modelle. Je nach Umfang und Komplexität können diese Aufgaben von Crowdsourcing-Mitarbeitern auf Plattformen wie MTurk sowie von geschulten Annotatoren wie Forschungsassistenten durchgeführt werden.
Wir wissen, dass große Sprachmodelle (LLM) ab einem bestimmten Maßstab „entstehen“ können – das heißt, sie können neue Fähigkeiten erwerben, die zuvor unvorhergesehen waren. Als großes Modell, das einen neuen Ausbruch der KI fördert, haben die Fähigkeiten von ChatGPT bei vielen Aufgaben die Erwartungen der Menschen übertroffen, einschließlich der Kennzeichnung von Datensätzen und der Selbstschulung.
Kürzlich haben Forscher der Universität Zürich gezeigt, dass ChatGPT Crowdsourcing-Arbeitsplattformen und menschliche Arbeitsassistenten bei mehreren Annotationsaufgaben, einschließlich Relevanz-, Haltungs-, Themen- und Frame-Erkennung, übertrifft.
Darüber hinaus haben die Forscher nachgerechnet: ChatGPT kostet weniger als 0,003 US-Dollar pro Anmerkung – etwa 20-mal günstiger als MTurk. Diese Ergebnisse zeigen das Potenzial großer Sprachmodelle, die Effizienz der Textklassifizierung erheblich zu verbessern.
Link zum Papier:https://arxiv.org/abs/2303.15056
Forschungsdetails
Viele NLP-Anwendungen erfordern qualitativ hochwertige annotierte Daten, insbesondere für das Training von Klassifizierungsprozessoren oder zur Auswertung die Leistung unbeaufsichtigter Modelle. Beispielsweise müssen Forscher manchmal verrauschte Social-Media-Daten nach Relevanz filtern, Texte verschiedenen Themen- oder Konzeptkategorien zuordnen oder ihre emotionale Haltung messen. Unabhängig von der spezifischen Methode, die für diese Aufgaben verwendet wird (überwachtes, halbüberwachtes oder unüberwachtes Lernen), sind genau gekennzeichnete Daten erforderlich, um einen Trainingssatz zu erstellen oder ihn als Goldstandard zur Leistungsbewertung zu verwenden.
Der übliche Weg, damit umzugehen, besteht darin, wissenschaftliche Mitarbeiter einzustellen oder Crowdsourcing-Plattformen wie MTurk zu nutzen. Als OpenAI ChatGPT entwickelte, vergab es auch das Problem negativer Inhalte an eine Datenanmerkungsagentur in Kenia und führte vor der offiziellen Einführung zahlreiche Anmerkungsschulungen durch.
Dieser von der Universität Zürich in der Schweiz vorgelegte Bericht untersucht das Potenzial großer Sprachmodelle (LLM) in Textannotationsaufgaben, mit Schwerpunkt auf ChatGPT, veröffentlicht im November 2022. Es beweist, dass ChatGPT Zero-Shot (d. h. ohne zusätzliche Schulung) die MTurk-Annotation bei Klassifizierungsaufgaben übertrifft und nur ein paar Zehntel der Kosten manueller Arbeit beträgt.
Die Forscher verwendeten eine Stichprobe von 2.382 Tweets, die in einer früheren Studie gesammelt wurden. Die Tweets wurden von geschulten Annotatoren (wissenschaftlichen Mitarbeitern) für fünf verschiedene Aufgaben gekennzeichnet: Relevanz, Haltung, Thema und Zwei-Frame-Erkennung. Im Experiment übergab der Forscher die Aufgabe an ChatGPT als Zero-Shot-Klassifizierung und gleichzeitig an die Crowdsourcing-Mitarbeiter auf MTurk und bewertete dann die Leistung von ChatGPT anhand von zwei Benchmarks: relativ zur Genauigkeit menschlicher Mitarbeiter auf der Crowdsourcing-Plattform, und Genauigkeit im Vergleich zu wissenschaftlichen Hilfskommentatoren.
Es wurde festgestellt, dass die Zero-Sample-Genauigkeit von ChatGPT bei vier von fünf Aufgaben höher war als die von MTurk. Bei allen Aufgaben übertrifft die Encodervereinbarung von ChatGPT die von MTurk und geschulten Kommentatoren. Darüber hinaus ist ChatGPT hinsichtlich der Kosten viel günstiger als MTurk: Fünf Klassifizierungsaufgaben kosten bei ChatGPT etwa 68 US-Dollar (25264 Anmerkungen) und bei MTurk etwa 657 US-Dollar (12632 Anmerkungen).
Die Kosten pro Anmerkung bei ChatGPT betragen also etwa 0,003 US-Dollar oder ein Drittel eines Cents – etwa 20-mal günstiger als bei MTurk und von höherer Qualität. Vor diesem Hintergrund ist es nun möglich, mehr Beispiele zu kommentieren oder große Trainingssätze für überwachtes Lernen zu erstellen. Basierend auf vorhandenen Tests kosten 100.000 Anmerkungen etwa 300 US-Dollar.
Während weitere Forschung erforderlich ist, um besser zu verstehen, wie ChatGPT und andere LLMs in einem breiteren Kontext funktionieren, deuten diese Ergebnisse darauf hin, dass sie das Potenzial haben, die Art und Weise, wie Forscher Daten annotieren, zu verändern und MTurk zu stören, sagen die Forscher einige Geschäftsmodelle anderer Plattformen .
Experimentelles Verfahren
Die Forscher verwendeten einen Datensatz von 2382 Tweets, die aus früheren Studien zu Aufgaben im Zusammenhang mit der Inhaltsmoderation manuell mit Anmerkungen versehen wurden. Konkret erstellten geschulte Annotatoren (wissenschaftliche Mitarbeiter) Goldstandards für fünf konzeptionelle Kategorien mit unterschiedlicher Anzahl von Kategorien: Relevanz von Tweets für Fragen der Inhaltsmoderation (relevant/irrelevant); in Bezug auf Artikel 230 (Position als Teil des U.S. Communications Decency Act von 1996). , ein wichtiger Teil der US-amerikanischen Internetgesetzgebung; Themenidentifizierung (sechs Kategorien); Rahmenwerke der Gruppe 1 (Inhaltsmoderation als Problem, Lösung oder neutral);
Die Forscher führten dann genau dieselben Klassifizierungen mithilfe von ChatGPT und Crowdsourcing-Arbeitern durch, die auf MTurk rekrutiert wurden. Für ChatGPT wurden vier Anmerkungssätze erstellt. Um die Auswirkungen des ChatGPT-Temperaturparameters zu untersuchen, der den Grad der Zufälligkeit in der Ausgabe steuert, wird er hier mit den Standardwerten 1 und 0,2 annotiert, was eine geringere Zufälligkeit impliziert. Für jeden Temperaturwert führten die Forscher zwei Annotationssätze durch, um die Encoder-Übereinstimmung von ChatGPT zu berechnen.
Für die Experten ergab die Studie, dass zwei Doktoranden der Politikwissenschaft Tweets für alle fünf Aufgaben kommentierten. Für jede Aufgabe erhielten die Programmierer die gleichen Anweisungen und wurden gebeten, Tweets von Aufgabe zu Aufgabe unabhängig zu kommentieren. Um die Genauigkeit von ChatGPT und MTurk zu berechnen, wurden beim Vergleich nur Tweets berücksichtigt, denen beide geschulten Kommentatoren zustimmten.
Für MTurk besteht das Ziel der Forschung darin, die beste Gruppe von Arbeitnehmern auszuwählen, insbesondere durch die Überprüfung von Arbeitnehmern, die von Amazon als „MTurk Masters“ eingestuft werden, mehr als 90 % positive Bewertungen haben und in den Vereinigten Staaten ansässig sind .
Diese Studie verwendet die „gpt-3.5-turbo“-Version der ChatGPT-API, um Tweets zu klassifizieren. Die Kommentierung erfolgte zwischen dem 9. März und dem 20. März 2023. Für jede Anmerkungsaufgabe haben die Forscher bewusst darauf verzichtet, ChatGPT-spezifische Aufforderungen wie „Lass uns Schritt für Schritt denken“ hinzuzufügen, um die Vergleichbarkeit zwischen ChatGPT- und MTurk-Crowdworkern sicherzustellen.
Nachdem wir mehrere Varianten getestet hatten, beschlossen die Leute, Tweets einzeln an ChatGPT zu senden, indem sie eine Eingabeaufforderung wie diese verwendeten: „Dies ist der Tweet, den ich ausgewählt habe. Markieren Sie ihn bitte mit [aufgabenspezifischen Anweisungen (z. B. Eines der Themen im Beschreibung)] Darüber hinaus wurden für jeden Tweet in dieser Studie vier ChatGPT-Antworten gesammelt und für jeden Tweet eine neue Chat-Sitzung erstellt, um sicherzustellen, dass die ChatGPT-Ergebnisse nicht durch den Anmerkungsverlauf beeinflusst wurden
Abbildung 1. ChatGPT-Zero-Shot-Textannotationsfunktionen im Vergleich zu Annotatoren mit hoher Punktzahl auf MTurk. Die Genauigkeit von ChatGPT ist in vier von fünf Aufgaben besser als bei MTurk In der obigen Abbildung hat ChatGPT in einem Fall (Relevanz) einen leichten Vorteil, in den anderen drei Fällen (Frames I, Frames II und Stance) ist die Leistung jedoch sehr ähnlich. ChatGPT schneidet 2,2- bis 3,4-mal besser ab als MTurk. Angesichts der Schwierigkeit der Aufgabe, der Anzahl der Klassen und der Tatsache, dass es sich bei den Anmerkungen um Nullstichproben handelt, ist die Genauigkeit von ChatGPT im Allgemeinen für die Korrelation mehr als ausreichend. Mit zwei Kategorien (relevant/irrelevant) verfügt ChatGPT über eine Die Genauigkeit liegt bei 72,8 %, bei drei Kategorien (positiv/negativ/neutral) beträgt die Genauigkeit 78,7 %, wenn die Anzahl der Kategorien abnimmt, obwohl auch die intrinsische Schwierigkeit der Aufgabe eine Rolle spielt Protokoll, Abbildung 1 zeigt, dass die Leistung von ChatGPT sehr hoch ist und die Leistung bei allen Aufgaben 95 % übersteigt, wenn der Temperaturparameter auf 0,2 eingestellt ist. Einschließlich geschulter Annotatoren ist die Beziehung zwischen den Codern höher und die Genauigkeit ist positiv, selbst wenn der Standardtemperaturwert 1 verwendet wird (was mehr Zufälligkeit impliziert). Obwohl die Korrelation nur auf fünf Datenpunkten basiert, deutet sie auf niedrigere Temperaturwerte hin möglicherweise besser für die Anmerkungsaufgabe geeignet, da es die Konsistenz der Ergebnisse zu verbessern scheint, ohne die Genauigkeit drastisch zu verringern. Darüber hinaus muss betont werden, dass das Testen von ChatGPT ein komplexes Thema ist. Forscher haben konzeptionelle Kategorien für bestimmte Forschungszwecke entwickelt. Einige Aufgaben umfassen eine große Anzahl von Kategorien, dennoch erreicht ChatGPT immer noch eine hohe Genauigkeit
Die Verwendung von Modellen zur Annotation von Daten ist nichts Neues. In der Informatikforschung, die große Datensätze verwendet, beschriften Menschen oft eine kleine Anzahl von Proben und erweitern sie dann durch maschinelles Lernen. Nachdem wir jedoch den Menschen übertroffen haben, können wir den Urteilen von ChatGPT in Zukunft möglicherweise mehr vertrauen.
Das obige ist der detaillierte Inhalt vonWird ChatGPT die Datenanmerkungsbranche zerstören? 20-mal günstiger als Menschen und genauer. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Bei der Konvertierung von Zeichenfolgen in Objekte in Vue.js wird JSON.Parse () für Standard -JSON -Zeichenfolgen bevorzugt. Bei nicht standardmäßigen JSON-Zeichenfolgen kann die Zeichenfolge durch Verwendung regelmäßiger Ausdrücke verarbeitet und Methoden gemäß dem Format oder dekodierten URL-kodiert reduziert werden. Wählen Sie die entsprechende Methode gemäß dem String -Format aus und achten Sie auf Sicherheits- und Codierungsprobleme, um Fehler zu vermeiden.

Der Artikel führt den Betrieb der MySQL -Datenbank vor. Zunächst müssen Sie einen MySQL -Client wie MySQLworkBench oder Befehlszeilen -Client installieren. 1. Verwenden Sie den Befehl mySQL-uroot-P, um eine Verbindung zum Server herzustellen und sich mit dem Stammkonto-Passwort anzumelden. 2. Verwenden Sie die Erstellung von Createdatabase, um eine Datenbank zu erstellen, und verwenden Sie eine Datenbank aus. 3.. Verwenden Sie CreateTable, um eine Tabelle zu erstellen, Felder und Datentypen zu definieren. 4. Verwenden Sie InsertInto, um Daten einzulegen, Daten abzufragen, Daten nach Aktualisierung zu aktualisieren und Daten nach Löschen zu löschen. Nur indem Sie diese Schritte beherrschen, lernen, mit gemeinsamen Problemen umzugehen und die Datenbankleistung zu optimieren, können Sie MySQL effizient verwenden.

Verarbeiten Sie 7 Millionen Aufzeichnungen effizient und erstellen Sie interaktive Karten mit Geospatial -Technologie. In diesem Artikel wird untersucht, wie über 7 Millionen Datensätze mithilfe von Laravel und MySQL effizient verarbeitet und in interaktive Kartenvisualisierungen umgewandelt werden können. Erstes Herausforderungsprojektanforderungen: Mit 7 Millionen Datensätzen in der MySQL -Datenbank wertvolle Erkenntnisse extrahieren. Viele Menschen erwägen zunächst Programmiersprachen, aber ignorieren die Datenbank selbst: Kann sie den Anforderungen erfüllen? Ist Datenmigration oder strukturelle Anpassung erforderlich? Kann MySQL einer so großen Datenbelastung standhalten? Voranalyse: Schlüsselfilter und Eigenschaften müssen identifiziert werden. Nach der Analyse wurde festgestellt, dass nur wenige Attribute mit der Lösung zusammenhängen. Wir haben die Machbarkeit des Filters überprüft und einige Einschränkungen festgelegt, um die Suche zu optimieren. Kartensuche basierend auf der Stadt

Vue- und Element-UI-kaskadierte Dropdown-Boxen V-Model-Bindung gemeinsame Grubenpunkte: V-Model bindet ein Array, das die ausgewählten Werte auf jeder Ebene des kaskadierten Auswahlfelds darstellt, nicht auf einer Zeichenfolge; Der Anfangswert von ausgewählten Optionen muss ein leeres Array sein, nicht null oder undefiniert. Die dynamische Belastung von Daten erfordert die Verwendung asynchroner Programmierkenntnisse, um Datenaktualisierungen asynchron zu verarbeiten. Für riesige Datensätze sollten Leistungsoptimierungstechniken wie virtuelles Scrollen und fauler Laden in Betracht gezogen werden.

Zusammenfassung: Es gibt die folgenden Methoden zum Umwandeln von VUE.JS -String -Arrays in Objektarrays: Grundlegende Methode: Verwenden Sie die Kartenfunktion, um regelmäßige formatierte Daten zu entsprechen. Erweitertes Gameplay: Die Verwendung regulärer Ausdrücke kann komplexe Formate ausführen, müssen jedoch sorgfältig geschrieben und berücksichtigt werden. Leistungsoptimierung: In Betracht ziehen die große Datenmenge, asynchrone Operationen oder effiziente Datenverarbeitungsbibliotheken können verwendet werden. Best Practice: Clear Code -Stil, verwenden Sie sinnvolle variable Namen und Kommentare, um den Code präzise zu halten.

Um die Zeitüberschreitung für Vue Axios festzulegen, können wir eine Axios -Instanz erstellen und die Zeitleitungsoption angeben: in globalen Einstellungen: vue.Prototyp. $ Axios = axios.create ({Timeout: 5000}); In einer einzigen Anfrage: this. $ axios.get ('/api/user', {timeout: 10000}).

Remote Senior Backend Engineer Job Vacant Company: Circle Standort: Remote-Büro-Jobtyp: Vollzeitgehalt: 130.000 bis 140.000 US-Dollar Stellenbeschreibung Nehmen Sie an der Forschung und Entwicklung von Mobilfunkanwendungen und öffentlichen API-bezogenen Funktionen, die den gesamten Lebenszyklus der Softwareentwicklung abdecken. Die Hauptaufgaben erledigen die Entwicklungsarbeit unabhängig von RubyonRails und arbeiten mit dem Front-End-Team von React/Redux/Relay zusammen. Erstellen Sie die Kernfunktionalität und -verbesserungen für Webanwendungen und arbeiten Sie eng mit Designer und Führung während des gesamten funktionalen Designprozesses zusammen. Fördern Sie positive Entwicklungsprozesse und priorisieren Sie die Iterationsgeschwindigkeit. Erfordert mehr als 6 Jahre komplexes Backend für Webanwendungen

Die MySQL -Leistungsoptimierung muss von drei Aspekten beginnen: Installationskonfiguration, Indexierung und Abfrageoptimierung, Überwachung und Abstimmung. 1. Nach der Installation müssen Sie die my.cnf -Datei entsprechend der Serverkonfiguration anpassen, z. 2. Erstellen Sie einen geeigneten Index, um übermäßige Indizes zu vermeiden und Abfrageanweisungen zu optimieren, z. B. den Befehl Erklärung zur Analyse des Ausführungsplans; 3. Verwenden Sie das eigene Überwachungstool von MySQL (ShowProcessList, Showstatus), um die Datenbankgesundheit zu überwachen und die Datenbank regelmäßig zu sichern und zu organisieren. Nur durch kontinuierliche Optimierung dieser Schritte kann die Leistung der MySQL -Datenbank verbessert werden.
