"ChatGPT Nemesis" a été mis à jour !
C'est vrai, il s'agit du GPTZero construit par le frère chinois Edward Tian. En quelques secondes, vous pourrez découvrir si le texte a été écrit par des humains ou par une IA.
Près d'un mois plus tard, la version lancée par le gars s'appelle GPTZeroX, et il a également déclaré :
Il s'agit d'un modèle d'IA spécialement conçu pour les éducateurs.
Dès que la nouvelle est sortie, elle a immédiatement attiré un afflux important d'internautes, avec 400 000 visites et 2,2 millions de demandes de service en une journée.
Alors cette fois, quelles nouvelles fonctionnalités apporte ce « ChatGPT Nemesis » ?
Une caractéristique majeure de la mise à niveau est que GPTZeroX peut détecter le contenu du texte écrit par « humain + IA ».
Par exemple, on lance d'abord une nouvelle écrite par des humains dans le test :
GPTZeroX donne la réponse très rapidement en quelques secondes seulement :
Votre texte est susceptible d'être entièrement écrit par un humain.
Votre texte est très probablement entièrement écrit par un humain.
Ensuite, jetons un morceau de texte écrit par ChatGPT à la fin de l'actualité et effectuons une détection mixte :
Cette fois, la réponse de GPTZero est :
Votre texte comprend des parties écrites par l'IA.
Une partie de votre texte est écrite par l'IA.
Et le contenu généré par ChatGPT sera également surligné en jaune.
Brother a dit :
C'est une fonctionnalité clé que les éducateurs ont toujours recherchée.
Mais lorsque les enseignants vérifient les devoirs des élèves, copier et coller du texte paragraphe par paragraphe est une tâche assez fastidieuse.
Depuis, ce type a également lancé une autre nouvelle fonctionnalité : la possibilité d'importer des fichiers par lots, prenant en charge Word, PDF, TXT et d'autres formats.
Et lorsque le site Web introduit cette fonction, il la décrit ainsi
:
De plus, afin d'éviter que le service ne plante, j'ai également construit une API Python, qui a complété le stress tester en quelque sorte.
Finalement, le petit frère dit quelque chose d'un ton pensif :
Je promets que ce site restera gratuit pour les enseignants et éducateurs individuels !
Il s'appuie principalement sur la « perplexité », c'est-à-dire la « perplexité » du texte, comme indicateur pour déterminer qui a écrit le contenu donné.
Les amis du domaine de la PNL savent tous que cet indicateur est utilisé pour évaluer la qualité d'un modèle de langage.
Ici, chaque fois que vous alimentez GPTZero avec un morceau de contenu de test, il calculera respectivement :
1. Confusion totale du texte
Plus cette valeur est élevée, plus il est probable qu'il soit écrit par des humains.
2. Confusion moyenne de toutes les phrases
Plus la phrase est longue, plus cette valeur est généralement faible.
3. La confusion de chaque phrase
est présentée sous forme de diagramme à barres. Vous pouvez passer la souris sur chaque case pour voir quelle est la phrase correspondante (il n'y a que deux blocs ici, car le contenu du test. J'ai entré à ce moment-là, c'est deux phrases).
L'auteur a également expliqué la raison pour laquelle un tel diagramme à barres est dessiné :
Selon certaines des dernières recherches : certaines phrases écrites par des humains peuvent avoir un degré de confusion plus faible (comme mentionné précédemment, la confusion humaine est relativement élevé), mais à mesure que vous continuez à écrire, la confusion va forcément atteindre son paroxysme.
En revanche, avec le texte généré automatiquement, la perplexité est uniformément répartie et toujours faible.
De plus, GPTZero sélectionnera également la phrase la plus confuse (c'est-à-dire la phrase qui ressemble le plus à un humain) :
Comme le dit le proverbe , plus le moral est élevé, plus le diable est élevé, tandis que ChatGPT montre ses diverses compétences en arts martiaux, des outils et des recherches sur « vaincre la magie avec la magie » comme GPTZero émergent également les uns après les autres.
Par exemple, l'Université de Stanford a récemment lancé un artefact « anti-reconnaissance » - DetectGPT afin d'empêcher les étudiants d'utiliser ChatGPT pour rédiger des articles ou tricher.
Cette méthode ne nécessite ni la formation d'un classificateur séparé ni la collecte d'un ensemble de données de passages réels ou générés, et est une méthode sans tir basée sur la courbure probabiliste.
De plus, même OpenAI lui-même a créé conjointement un détecteur avec Harvard et d'autres universités et institutions : le détecteur de sortie GPT-2.
Les auteurs ont d'abord publié un ensemble de données "Contenu généré par GPT-2" et WebText (spécialement extrait de Reddit, une barre de publication étrangère) pour permettre à l'IA de comprendre la différence entre le "langage de l'IA" et la "parole humaine".
Par la suite, cet ensemble de données a été utilisé pour affiner le modèle RoBERTa et le détecteur IA a été obtenu. La parole humaine est toujours reconnue comme vraie et le contenu généré par l’IA est toujours reconnu comme faux.
(RoBERTa est une version améliorée de BERT. Le BERT original utilisait un ensemble de données de 13 Go, mais RoBERTa utilisait un ensemble de données de 160 Go contenant 63 millions d'informations en anglais.)
…
Eh bien, il semble que ChatGPT soit très populaire dans le monde Tout en avançant, il favorise également le développement de la recherche « anti-ChatGPT ».
Lien de référence : [1] https://twitter.com/edward_the6/status/1619874139954905090[2] https://arxiv.org/abs/2301.11305
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!