L'IA ne peut pas battre l'IA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions d'enseignants-IA-php.cn

L'IA ne peut pas battre l'IA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions d'enseignants

王林

Libérer： 2023-04-10 23:41:01

avant

1126 Les gens l'ont consulté

Que ressentez-vous lorsque vous êtes innocemment qualifié de « tricheur » par l'IA ?

C'est arrivé à Lucy Goetz, une lycéenne. Elle a initialement écrit un article original sur le socialisme qui a obtenu le score le plus élevé.

Cependant, le détecteur d'écriture AI de Turnitin a en fait indiqué que la fin de l'article de Goetz avait été générée à l'aide de ChatGPT.

Goetz a été choqué et a déclaré : "Je suis très heureux d'entretenir de bonnes relations avec les enseignants."

Bref, heureusement que le professeur me comprend, sinon je ne pourrais pas me nettoyer même si je sautais dans le fleuve Jaune.

Ce qui est encore plus surprenant, c'est que ce détecteur ChatGPT est désormais utilisé par 2,1 millions d'enseignants.

L’IA ne peut pas battre l’IA

La partie marquée de l’article de Goetz est une anomalie, mais elle montre que les détecteurs font parfois des erreurs.

Évidemment, l’IA ne peut pas vaincre l’IA. Cela pourrait avoir des conséquences désastreuses pour de nombreux étudiants.

Pour tester le détecteur de Turnitin, le journaliste Geoffrey A. Fowler a testé 5 lycéens dont Goetz.

Ils ont créé 16 exemples d'articles couvrant des sources réelles, générées par l'IA et mixtes.

Quel a été le résultat ?

Le détecteur de Turnitin présentait des erreurs dans au moins la moitié des échantillons. Il n’en a identifié avec précision que 6, mais n’a pas réussi à en détecter 3. Cela inclut des erreurs de marquage dans 8 % de l'article original de Goetz.

Pour les 7 articles restants, Fowler a déclaré : "Je ne lui attribuerai que des notes partielles car ses jugements sont généralement corrects, mais il identifie mal certaines parties de l'écriture qui ont été générées par ChatGPT ou des sources mixtes ."

Cependant, Turnitin affirme que son détecteur a une précision globale de 98%. La société a également déclaré que lors de ses propres tests, des situations comme celle de l'article de Goetz (c'est-à-dire des faux positifs) se produisaient dans moins de 1 % du temps. La page de détails du détecteur d'IA de Turnitin attribue un score global et met en évidence les phrases suspectées générées par l'IA. La société a déclaré avoir intentionnellement marqué les passages soupçonnés d’être générés par l’IA en bleu au lieu de rouge et avoir lié les ressources des enseignants en dessous du score.

LIA ne peut pas battre lIA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions denseignants

Rebecca Dell, professeur d'anglais AP à Goetz à Concord, en Californie, a déclaré que le système de Turnitin pour marquer le texte de l'IA ne fonctionne pas toujours, ce qui est préoccupant.

Contrairement aux accusations de plagiat, la triche de l'IA n'a pas de documents sources comme preuve, ce qui est le moyen le plus simple pour les enseignants d'avoir des préjugés contre les étudiants.

Peut-être que tout le monde n'a pas autant de chance que Goetz.

LIA ne peut pas battre lIA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions denseignants

Goetz a déclaré : "Pour les étudiants, être accusé de tricherie avec l'IA est particulièrement effrayant. À moins que votre professeur ne comprenne votre style d'écriture ou n'ait une grande confiance en vous, il n'y a aucun moyen de prouver que vous ne trichez pas."

Pourquoi la détection de l'IA est si difficile

Depuis le lancement de ChatGPT, il a été utilisé par les étudiants et les enseignants de nombreuses universités dans leurs devoirs et leur enseignement quotidiens.

Cependant, s'il n'est pas restreint, ChatGPT deviendra l'outil de triche le plus puissant de l'histoire, qui peut aider les étudiants à rédiger leurs devoirs et même à terminer leurs examens.

Afin de contrer la reconnaissance, un détecteur simple et facile à utiliser est devenu ce que les enseignants attendent avec impatience. Edward Tian, un étudiant de 22 ans à l'Université de Princeton, a développé lui-même un détecteur, le GPTZero.

Même, OpenAI a officiellement annoncé le lancement d'un nouvel outil, un détecteur de fichiers appelé AI Text Classifier.

Cependant, les performances de ces détecteurs ne sont pas satisfaisantes.

Détecter le contenu créé par l'IA semble facile. Mais lorsque vous recevez un email manuscrit et un email généré par ChatGPT, il nous est quasiment impossible de faire la différence.

Eric Wang, vice-président de l'intelligence artificielle chez Turnitin, a déclaré que l'utilisation d'un logiciel pour détecter l'écriture de l'intelligence artificielle implique des statistiques. D’un point de vue statistique, ce qui distingue l’intelligence artificielle de l’humain, c’est qu’elle est extrêmement stable au niveau moyen.

Pour parler franchement, le niveau de l'IA est très stable. Cependant, ce n’est pas réellement le cas.

"Un système comme ChatGPT est comme une version avancée de la saisie semi-automatique, recherchant le prochain mot le plus susceptible d'être écrit. C'est en fait pourquoi il se lit si naturellement. L'écriture IA est une écriture humaine. Le sous-ensemble le plus probable de . "

Le détecteur de Turnitin "identifiera la situation moyenne où l'écriture est trop cohérente". Le défi est que parfois l’écriture humaine peut sembler moyenne.

En économie, en mathématiques et dans les rapports de laboratoire, les étudiants ont tendance à suivre un style d'écriture fixe, ce qui signifie qu'ils sont plus susceptibles d'être confondus avec l'écriture de l'IA.

C'est probablement la raison pour laquelle Turnitin a signalé par erreur l'article de Goetz parce que son contenu était lié à l'économie.

Wang a déclaré que Turnitin a travaillé dur pour peaufiner son système afin d'exiger un niveau de confiance plus élevé avant de qualifier une phrase de générée par l'IA pour commettre des erreurs à cet égard.

et dit que son logiciel a fait de grands progrès. «Lorsque j'ai testé pour la première fois l'article de Goetz fin janvier, le logiciel a identifié environ 50 % d'entre eux comme étant générés par l'IA. Turnitin a de nouveau analysé mon échantillon dans son système fin mars, et à cette époque, seuls 8 des articles de Goetz étaient signalés. généré par l'IA. "

Le détecteur de Turnitin est également confronté à d'autres limitations techniques importantes.

LIA ne peut pas battre lIA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions denseignants

Sur les 6 échantillons détectés de manière tout à fait correcte, ils étaient tous clairement des travaux d'étudiants à 100 %, ou générés par ChatGPT.

Mais lorsqu'il a été testé avec des articles mêlant IA et sources humaines, il a souvent mal identifié des phrases individuelles ou a complètement manqué la partie humaine. Et il n’a pas pu détecter de traces de ChatGPT dans les documents traités via Quillbot, un programme de réécriture capable de recombiner des phrases.

De plus, le détecteur de Turnitin est peut-être déjà en retard sur le niveau actuel de la technologie de l'intelligence artificielle.

Parce que prenez ChatGPT par exemple, il a maintenant été béni par GPT-4 et possède des capacités plus créatives et stylisées.

Jim Fan, scientifique chez NVIDIA, a déclaré : « Je pense que le détecteur n'est pas fiable à long terme. L’intelligence artificielle s’améliorera de plus en plus et rédigera de manière de plus en plus humaine. On peut affirmer sans se tromper que ces bizarreries du modèle linguistique diminueront avec le temps.

LIA ne peut pas battre lIA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions denseignants

Est-ce une bonne idée d'utiliser l'IA pour la détection ?

Pourquoi sortir un détecteur IA alors qu'il y a un potentiel d'erreur (même s'il n'est que de 1%) ?

Chechitelli a déclaré : "Les enseignants espèrent avoir un effet dissuasif." Cependant, certains éducateurs craignent que cela puisse en fait augmenter le niveau de stress des élèves.

LIA ne peut pas battre lIA ! Le détecteur ChatGPT accuse fréquemment des étudiants innocents et est utilisé par 2,1 millions denseignants

Le 4 avril, Turnitin a activé ce détecteur ChatGPT pour environ 10 700 établissements d'enseignement secondaire et supérieur afin de fournir une notation « générée par l'IA » et une analyse phrase par phrase des devoirs des étudiants.

Mitchel Sollenberger, vice-recteur pour l'éducation numérique à l'Université du Michigan-Dearborn, a demandé à Turnitin de ne pas activer la détection de l'IA pour son campus lors du lancement initial.

Il craint que les enseignants qui testent environ 20 000 copies d'étudiants chaque semestre via Turnitin puissent recevoir des faux positifs, conduisant à des enquêtes infondées sur l'intégrité académique. On ne s’attend pas à ce que les enseignants deviennent des experts en systèmes logiciels tiers.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!