Du meinst ChatGPT, die Dinge, die es schreibt, sind so realistisch, dass man sie nicht unterscheiden kann?
Es spielt keine Rolle!
Jetzt ist sein „Erzfeind“ da –
Ein Chinese hat eine solche Website erstellt, um festzustellen, ob Text von KI oder von Menschen geschrieben wurde.
Sie müssen nur den entsprechenden Inhalt einfügen und die Ergebnisse werden innerhalb weniger Sekunden analysiert.
Es: „Ich wusste, dass es KI war.“
Sobald eine solche magische Waffe herauskam, konnte man sagen, dass sie schnell alle Herzen eroberte.
Nein, es wird den Server direkt zerstören (zum Glück gibt es einen Ersatzserver).
Werden nun auch die „frechen Kinder“, die ChatGPT zum Erledigen ihrer Hausaufgaben nutzen, darunter leiden?
an. Diese Website heißt GPTZero.
Es stützt sich hauptsächlich auf „Perplexität“, also die „Perplexität“ des Textes, als Indikator, um festzustellen, wer den gegebenen Inhalt geschrieben hat.
Freunde im NLP-Bereich wissen alle, dass dieser Indikator zur Bewertung der Qualität eines Sprachmodells verwendet wird.
Hier wird jedes Mal, wenn Sie GPTZero einen Testinhalt füttern, Folgendes berechnet:
1, Gesamttextverwirrung
Je höher der Wert , desto wahrscheinlicher ist es, dass es von einem Menschen gemacht wurde.
2. Die durchschnittliche Verwirrung aller Sätze
Je länger der Satz, desto niedriger ist normalerweise dieser Wert.
3. Der Verwirrungsgrad jedes Satzes
wird in Form eines Balkendiagramms angezeigt In jedem Feld können Sie die entsprechenden Sätze überprüfen (hier gibt es nur zwei Blöcke, da der Testinhalt, den ich zu diesem Zeitpunkt eingegeben habe, nur aus zwei Sätzen besteht).
Der Autor erklärte auch den Grund für die Zeichnung eines solchen Balkendiagramms:
Laut dem neuesten Some Studien: Einige von Menschen geschriebene Sätze weisen möglicherweise einen geringen Grad an Verwirrung auf (wie bereits erwähnt, ist die Verwirrung bei Menschen relativ hoch), aber wenn sie weiter schreiben, wird der Grad der Verwirrung zwangsläufig ihren Höhepunkt erreichen.
Im Gegensatz dazu ist die Ratlosigkeit bei maschinell generiertem Text gleichmäßig verteilt und stets gering.
Darüber hinaus wählt GPTZero auch den Satz mit dem höchsten Grad an Verwirrung aus (d. h. den Satz, der dem Menschen am ähnlichsten ist):
Das sind die Regeln, lasst uns einen praktischen Test machen.
Hier zunächst einmal die neuesten Nachrichten auf Englisch (Chinesisch wird derzeit zum Testen nicht unterstützt):
# 🎜🎜##🎜 🎜#Fügen Sie es in das Testfeld ein (beachten Sie, dass jeder Satz mindestens 5 Wörter enthalten sollte. Es wird empfohlen, dass jeder Absatz 10 Sätze enthält, da die Ergebnisse genauer sind).
Bald berechnete GPTZero, dass die Gesamttextperplexität dieses Textes 27 betrug und die durchschnittliche Satzperplexität 171,2 betrug. Das Ratlosigkeitsdiagramm jedes Satzes sieht so aus:
# 🎜🎜#
und der Satz mit der höchsten Verwirrung hat einen Wert von 476.
Wenn Sie sich dieses Ergebnis ansehen, haben Sie vielleicht die Antwort von GPTZero erraten:wurde von Menschen geschrieben.
Richtige Antwort.
Werfen wir einen Blick auf ChatGPT.
Fügen Sie den Inhalt in das Testfeld ein und stellen Sie fest, dass die Gesamttextverwirrung dieses Textes 31 und die durchschnittliche Satzverwirrung 76,67 beträgt Das Verwirrungsdiagramm sieht folgendermaßen aus:
und der Wert des Satzes mit der höchsten Verwirrung beträgt 99.
Es scheint, dass jeder Verwirrungswert ganz anders ist als der oben stehende. Sie sollten in der Lage sein, zu erraten, dass er von KI geschrieben wurde.
Leider kann GPTZero keine Antwort geben und ich hoffe, wir können versuchen, etwas mehr Text hinzuzufügen.
Offensichtlich enthält dieser Absatz genügend Wörter, aber nicht genügend Sätze, um es GPTZero zu ermöglichen, die „Verkleidung“ von ChatGPT auf einen Blick zu durchschauen.
Dann versuchen wir es mit einer weiteren ChatGPT-Sitzung.
Diesmal ist der Inhalt lang genug und es gibt genügend Sätze.
Tatsächlich hat GPTZero richtig geantwortet:
Es scheint, dass er tatsächlich einige Tricks herausgefunden hat:
#🎜 🎜#Das heißt, wenn es viele Wörter gibt, muss es auch eine große Anzahl von Sätzen geben, mindestens 5 Sätze, damit GPTZero anhand der Histogrammverteilung identifizieren kann und die endgültige Genauigkeit verbessert werden kann. Darüber hinaus haben wir festgestellt, dass es beim Scheitern der Herausforderung zusätzlich zu den oben genannten Fehlern beim Erkennen auch direkte Erkennungsfehler gab – Zum Beispiel: Beurteilen Sie die Nachrichten von KI geschrieben, wie von Menschen geschrieben:
In diesem Fall kann das Befolgen der oben genannten Tipps durch das Hinzufügen weiterer Inhalte möglicherweise zu den Ergebnissen führen.
(Beachten Sie, dass es möglich ist. Was die Nachrichten oben betrifft, haben wir den gesamten Inhalt eingefügt, aber dort stand Nein und wir haben nach mehr gefragt.)
#🎜🎜 #PrincetonChineseBrotherProduced#🎜 🎜#Die Person, die diese Website erstellt hat, ist ein 22-jähriger chinesischer Junge, Edward Tian aus Toronto, Kanada.
Während seines Studiums kam er an die Tsinghua-Universität, um an einem vierwöchigen Stadtforschungsseminar teilzunehmen.
Ihm zufolge wurde dieser Antrag während der Neujahrsfeiertage in einem Café ausgefüllt.
Der Grund, warum ich diese Anwendung entwickeln möchte, ist einfach, dass es zu viel Hype um ChatGPT gibt und Menschen wissen sollten, welche Artikel von KI geschrieben werden.
Es befindet sich noch im Barebone-Stadium. Verbesserungen des Modells und der Analyse werden in den kommenden Wochen erwartet.
Darüber hinaus gab er bekannt, dass er einen Datensatz mit von Studenten verfassten Nachrichtenartikeln testet und hofft, irgendwann einen Artikel veröffentlichen zu können.
Tatsächlich ist dieser Typ nicht der Einzige, der ChatGPT nicht mag. Es gibt andere menschliche Organisationen, die KI-Textdetektoren entwickelt haben, auch bekannt als ChatGPT-Killer.
Die Grundidee ist ähnlich: „Benutze Magie, um Magie zu besiegen“ und nutze von der KI geschriebene Dinge, um neue KI zu trainieren.
Vor einiger Zeit hat sich OpenAI mit Harvard und anderen Universitäten zusammengetan, um gemeinsam einen Detektor zu entwickeln: GPT-2 Output Detector.
Die Autoren veröffentlichten zunächst einen Datensatz mit „GPT-2-generiertem Inhalt“ und WebText (speziell aus der ausländischen Beitragsleiste Reddit entnommen), sodass KI versteht den Unterschied zwischen „KI-Sprache“ und „menschlicher Sprache“.
Anschließend wurde dieser Datensatz zur Feinabstimmung des RoBERTa-Modells verwendet und der KI-Detektor erhalten. Menschliche Sprache wird immer als wahr erkannt und KI-generierte Inhalte werden immer als gefälscht erkannt.
(RoBERTa ist eine verbesserte Version von BERT. Das ursprüngliche BERT verwendete einen 13-GB-Datensatz, aber RoBERTa verwendete einen 160-GB-Datensatz mit 63 Millionen englischen Nachrichten.)
#🎜🎜 #Andere Aufgrund dieser neuen Entwicklung wurde auch der repräsentative Spieler der Anfangsjahre erneut erwähnt. Es handelt sich um das GLTR-Modell, das vom MIT-IBM Watson AI Laboratory und dem Harvard NLP Laboratory entwickelt wurde. Es führt hauptsächlich eine statistische Analyse und Visualisierung von Text durch und wird verwendet, um dasselbe oder ein ähnliches Modell zu erkennen, das ursprünglich zur Textgenerierung verwendet wurde. Derzeit werden hauptsächlich zwei Modelle unterstützt: GPT-2 und BERT. Da die Ausgabe die Rangfolge aller dem Modell bekannten Wörter ist, wird jedes Wort des Textes entsprechend der Rangfolge farblich gekennzeichnet. Die Top 10 sind grün, die Top 100 sind gelb, die Top 10 1000 sind rot, und die Top 1000 sind rot. Ein unwahrscheinliches Wort. Wenn ein Textstück zu viel gelbgrüne Farbe hat, dann wird dieser Text hauptsächlich von KI generiert. Dieses Mal erschien GPTZero erneut und viele Internetnutzer riefen aus: Unglaubliche Arbeit! Aber einige Leute sagen, dass Textdetektoren einfach ein gescheitertes Wettrüsten seien und ihre tatsächlichen Ergebnisse nicht gut seien. Es kann die Entwicklung von ChatGPT nicht stoppen. Gleichzeitig diskutierten einige Internetnutzer die Notwendigkeit, „ob der Artikel klar angeben muss, ob er von KI oder Menschen geschrieben wurde.“ Ein Songwriter glaubt, dass dies notwendig ist, genau wie beim Lesen einer Zeitschrift wird es mit „Anzeige“ gekennzeichnet, dies sollte eine einfache Anforderung sein. Aber einige Internetnutzer äußerten sofort ihren Widerstand. Warum Hindernisse errichten? Dies ähnelt der Verwendung von PS und dem anschließenden Hinzufügen eines Adobe-Wasserzeichens, was dem Produkt keinerlei Vorteile bringt. Was denken Sie über dieses Thema? Testlink: https://etedward-gptzero-main-zqgfwb.streamlit.app/Referenzlink: #🎜 🎜 #[1]https://brackets.substack.com/about
[2]https://www.reddit.com/r/programming/comments/102hxlg/gptzero_an_app_to_efficiently_tell_if_an_essay_is /
[3]https://twitter.com/Marc__Watkins/status/1601746409203863553
[4]http://gltr.io/
#🎜 🎜 #Das obige ist der detaillierte Inhalt vonDer „Erzfeind' von ChatGPT ist da! Ist der Autor des Artikels ein Mensch oder eine KI? Es hat ein paar Sekunden gedauert, bis der Chinese es geschafft hat. Der Server war bereits überfüllt.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!