Vous parlez de ChatGPT, les choses qu'il écrit sont si réalistes que vous ne pouvez pas les distinguer ?
Ce n'est pas grave !
Maintenant, son "ennemi" est là -
Un Chinois a créé un tel site Web pour identifier si le texte est écrit par l'IA ou par des êtres humains.
Il vous suffit de coller le contenu correspondant et les résultats seront analysés en quelques secondes.
Il : "Je savais que c'était l'IA."
Dès qu'un outil aussi magique a été publié, on peut dire qu'il a rapidement conquis le cœur de tout le monde.
Non, cela écrasera complètement le serveur (heureusement, il y en a un de rechange).
Maintenant, ces « vilains enfants » qui utilisent ChatGPT pour faire leurs devoirs vont aussi souffrir ?
Ce site Web s'appelle GPTZero.
Il s'appuie principalement sur la « perplexité », c'est-à-dire la « perplexité » du texte, comme indicateur pour déterminer qui a écrit le contenu donné.
Les amis du domaine de la PNL savent tous que cet indicateur est utilisé pour évaluer la qualité d'un modèle de langage.
Ici, chaque fois que vous alimentez GPTZero avec un morceau de contenu de test, il calculera respectivement :
1. Confusion totale du texte
Plus cette valeur est élevée, plus il est probable qu'il soit écrit par des humains.
2. Confusion moyenne de toutes les phrases
Plus la phrase est longue, plus cette valeur est généralement faible.
3. La perplexité de chaque phrase est présentée sous la forme d'un histogramme Vous pouvez passer la souris sur chaque case pour voir quelle est la phrase correspondante (il n'y a que deux blocs ici car le contenu du test que j'ai saisi. pour le moment, juste deux phrases).
L'auteur a également expliqué la raison pour laquelle il a dessiné un tel diagramme à barres :
Selon certaines des dernières recherches : certaines phrases écrites par des humains peuvent avoir un faible degré de confusion (comme mentionné précédemment, la confusion humaine Le degré est relativement élevé), mais à mesure que vous continuez à écrire, la confusion va forcément atteindre son paroxysme.En revanche, avec le texte généré automatiquement, la perplexité est uniformément répartie et toujours faible.
De plus, GPTZero sélectionnera également la phrase avec le plus haut degré de confusion (c'est-à-dire la phrase qui ressemble le plus à un humain) :
Ce sont les règles, testons-les.
Test 1 : Succès
Collez-le dans la zone de test (veuillez noter que chaque phrase doit contenir au moins 5 mots , il est recommandé que chaque paragraphe puisse contenir au moins 5 mots (10 phrases, le résultat sera plus précis).
Bientôt, GPTZero a calculé que la perplexité totale de ce texte était de 27, et la perplexité moyenne des phrases était de 171,2. Le graphique de perplexité de chaque phrase ressemblait à ceci :
et la valeur de la phrase avec la perplexité la plus élevée. était de 476.
En regardant ce résultat, vous avez peut-être deviné la réponse à GPTZero :
Il a été écrit par des humains.Bonne réponse.
Allez sur ChatGPT.
Collez le contenu dans la zone de test et constatez que la confusion totale du texte de ce texte est de 31 et que la confusion moyenne de la phrase est de 76,67. La confusion de chaque phrase ressemble à ceci :
et. la confusion La phrase la plus élevée a une valeur de 99.
Il semble que chaque valeur de confusion soit assez différente de celle ci-dessus. Vous devriez pouvoir deviner qu'elle a été écrite par l'IA.
Malheureusement, GPTZero ne peut pas donner la réponse, et j'espère que nous pourrons ajouter un peu plus de texte pour essayer.
Évidemment, ce paragraphe contient suffisamment de mots, mais pas assez de phrases pour permettre à GPTZero de voir à travers le « déguisement » de ChatGPT d'un seul coup d'œil.
Essayons à nouveau ChatGPT.
Cette fois, le contenu est assez long et il y a suffisamment de phrases.
Effectivement, il n'y a pas de problème. GPTZero a répondu directement :
Il semble qu'il ait effectivement trouvé quelques astuces :
C'est-à-dire que même s'il y a beaucoup de mots, le nombre de phrases doit aussi être grand, au moins 5 phrases, afin que GPTZero puisse transmettre l'histogramme. Avec la reconnaissance de codage distribuée, la précision finale peut être améliorée.
Une autre chose à mentionner est que lorsque le défi échoue, nous avons constaté qu'en plus de l'échec de reconnaissance mentionné ci-dessus, il existe également des erreurs de reconnaissance directe -
Par exemple, juger ce que l'IA écrit est ce qu'un adulte écrit :
Déterminer les nouvelles écrites par des humains en tant qu'IA :
Dans ce cas, en suivant les conseils mentionnés ci-dessus, l'ajout de contenu supplémentaire peut permettre d'inverser les résultats.
(Notez que c'est possible. Quant à la nouvelle ci-dessus, nous avons collé tout le contenu, mais elle a dit non et a demandé plus.)
qui a créé ce site Web, est un garçon chinois de 22 ans, Edward Tian, de Toronto, Canada.
Actuellement, je suis diplômé en informatique à Princeton aux États-Unis, avec une spécialisation en sciences cognitives et en journalisme. J'ai un fort intérêt pour le génie logiciel, l'apprentissage automatique, etc.
Il est maintenant stagiaire chez Microsoft, a écrit des articles techniques pour la BBC, Bellingcat et d'autres sociétés, et a également rejoint l'équipe fondatrice de l'outil cartographique Representable.
Pendant ses études, il est venu à l'Université Tsinghua pour participer à un séminaire de recherche urbaine de quatre semaines.
Selon lui, cette demande a été complétée dans un café pendant les vacances du Nouvel An.
La raison pour laquelle je souhaite développer cette application est simplement parce qu'il y a trop de battage médiatique autour de ChatGPT, et que les humains devraient savoir quels articles sont écrits par l'IA.
Actuellement au stade de base, des améliorations du modèle et de l'analyse sont attendues dans les semaines à venir.
En plus de cela, il a également révélé qu'il testait un ensemble de données d'articles de presse rédigés par des étudiants et espère éventuellement publier un article.
En fait, ce type n'est pas le seul à n'aime pas ChatGPT. Il existe d'autres organisations humaines qui ont développé des détecteurs de texte IA, AKA ChatGPT killers.
L'idée générale est similaire, c'est-à-dire "utiliser la magie pour vaincre la magie" et utiliser des éléments écrits par l'IA pour former de nouvelles IA.
Il y a quelque temps, OpenAI lui-même s'est associé à Harvard et à d'autres universités pour créer un détecteur : le GPT-2 Output Detector.
Les auteurs ont d'abord publié un "contenu généré par GPT-2" et un ensemble de données WebText (spécialement extraites de Reddit, une barre de publication étrangère) pour permettre à l'IA de comprendre la différence entre le "langage de l'IA" et la "parole humaine".
Par la suite, cet ensemble de données a été utilisé pour affiner le modèle RoBERTa et le détecteur IA a été obtenu. La parole humaine est toujours reconnue comme vraie et le contenu généré par l’IA est toujours reconnu comme faux.
(RoBERTa est une version améliorée de BERT. Le BERT original utilisait un ensemble de données de 13 Go, mais RoBERTa utilisait un ensemble de données de 160 Go contenant 63 millions d'informations en anglais.)
Un autre acteur représentatif dans les premières années, également à cause de cette période De nouveaux développements ont été à nouveau évoqués.
Il s'agit du modèle GLTR développé par le MIT-IBM Watson AI Laboratory et le Harvard NLP Laboratory.
Il effectue principalement une analyse statistique et une visualisation du texte, et est utilisé pour détecter le modèle identique ou similaire utilisé à l'origine pour générer du texte. Actuellement, il prend principalement en charge deux modèles : GPT-2 et BERT.
Étant donné que le résultat est le classement de tous les mots connus du modèle, chaque mot du texte est codé par couleur en fonction du classement. Le top 10 est vert, le top 100 est jaune, le top 1000 est rouge et violet. sont des mots qui sont moins susceptibles d'apparaître.
Si un morceau de texte a trop de couleur jaune-vert, alors ce texte est principalement généré par l'IA.
Cette fois, GPTZero est réapparu, et de nombreux internautes se sont exclamés : Travail incroyable !
Mais certaines personnes disent que les détecteurs de texte sont simplement une course aux armements ratée et que leurs résultats réels ne sont pas bons. Cela ne peut pas arrêter le développement de ChatGPT.
Dans le même temps, certains internautes ont discuté de la nécessité de « si l'article doit indiquer clairement s'il a été écrit par l'IA ou par des humains ».
Un auteur-compositeur estime que cela est nécessaire, tout comme « publicité » est marqué lors de la lecture d'un magazine, cela devrait être une simple exigence.
Mais certains internautes ont immédiatement exprimé leur opposition, pourquoi mettre des obstacles ? C'est comme utiliser PS puis ajouter un filigrane Adobe, ce qui n'apporte aucun avantage au produit.
Que pensez-vous de ce problème ?
Lien d'essai :
https://etedward-gptzero-main-zqgfwb.streamlit.app/
Lien de référence :
[1]https://brackets.substack.com/about
[2 ] https://www.reddit.com/r/programming/comments/102hxlg/gptzero_an_app_to_efficiently_tell_if_an_essay_is/
[3]https://twitter.com/Marc__Watkins/status/1601746409203863553
[4]http://gltr io. /
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!