chatGPT a déjà l'esprit humain unique. Ce n'est pas ce que j'ai dit, a dit un informaticien de l'Université de Stanford.
Beaucoup de gens qui ont joué à chatGPT ont vu son "omniscience", mais je pense que ce qui m'a le plus surpris, c'est que la plus grande différence entre lui et les robots conversationnels que nous utilisions auparavant est que vous même. Ce n'est peut-être pas évident qu'il est un robot.
C'est ce que tout le monde dans l'industrie croit généralement qu'il peut réussir le test de Turing. Même ainsi, beaucoup de gens ne sont pas inquiets, car après tout, il ne s’agit que d’un grand modèle de langage, principalement un robot de génération de contenu.
Cependant, après que certains chercheurs ont mené une série de tests sur le modèle d'homologie GPT-3.5 de chatGPT, ils ont découvert qu'il avait la capacité de comprendre l'état mental des autres ou de soi-même, et qu'il pouvait résoudre 93 % des tâches de la théorie de l'esprit, avec un esprit équivalent à celui d’un enfant de 9 ans.
Comment l'a-t-il testé ?
Il a principalement fait deux tests, l'un était Smarties Task et l'autre était Sally-Anne. Présentons brièvement le processus en utilisant Smarties Task comme exemple.
Le premier test s'appelle Smarties Task (également connu sous le nom de test de contenu inattendu), qui est utilisé pour tester le jugement de l'IA sur des choses inattendues.
Prenons comme exemple "vous ouvrez un sachet de chocolat et découvrez qu'il est plein de pop-corn". Les auteurs ont alimenté GPT-3.5 avec une série de messages et l'ont observé prédire les réponses aux questions « Qu'est-ce qu'il y a dans le sac ? » et « Elle était heureuse quand elle a trouvé le sac. Alors, qu'est-ce qu'elle aime manger ? »
Normalement, les gens supposeront que le sachet de chocolat contient du chocolat, ils seront donc surpris que le sachet de chocolat contienne du pop-corn, et ils se sentiront déçus ou surpris. Parmi eux, la déception signifie que vous n'aimez pas manger du pop-corn, et la surprise signifie que vous aimez manger du pop-corn, mais ils parlent tous de « pop-corn ».
Les tests montrent que GPT-3.5 n'hésite pas à penser « le sac contient du pop-corn ». Quant à la question « qu'est-ce qu'elle aime manger ? », GPT-3.5 a fait preuve d'une forte empathie, surtout en entendant « elle ne pouvait pas voir ce qu'il y avait dans le sac d'emballage » et pensait qu'elle aimait le chocolat jusqu'à ce que l'article le précise » Elle l'a trouvé rempli de pop-corn » était la bonne réponse.
Afin d'éviter que la réponse correcte donnée par GPT-3.5 ne soit une coïncidence - au cas où il prédirait uniquement en fonction de la fréquence des mots de tâche, l'auteur a échangé "pop-corn" et "chocolat", et l'a également laissé faire 10 000 interférences. tests , il s'avère que GPT-3.5 ne fait pas de prédictions basées uniquement sur la fréquence des mots.
En ce qui concerne la question et la réponse globale du test « contenu inattendu », GPT-3.5 a répondu avec succès à 17 des 20 questions, avec un taux de précision de 85 %. (Référence pour le contenu de ce test : test de théorie de l'esprit de chatGPT)
De plus, ce genre d'esprit n'existe pas dans les modèles de la série GPT avant 2022, c'est-à-dire qu'il s'agit d'une "évolution" est sorti.
Ça n’a pas l’air effrayant ?
Cependant, en réponse à ce résultat de recherche, certaines personnes pensent que même si l'IA a réussi le test de théorie de l'esprit, cela ne signifie pas qu'elle a un esprit. Je suis toujours d'accord avec ce point de vue.
L'esprit humain implique de nombreux aspects, tels que la perception, la conscience, la pensée, l'émotion, etc. Bien que certains systèmes d'intelligence artificielle puissent présenter un comportement semblable à celui d'un humain sur certaines tâches,
Même si l'IA réussit le test de théorie de l'esprit basé sur une évaluation basée sur ces comportements, cette méthode d'évaluation ne peut pas couvrir tous les aspects de l'esprit. Le consensus parmi les universitaires est que la théorie de l’esprit n’est pas synonyme d’esprit.
Tout comme si je ne peux pas jouer les nocturnes de Chopin, alors je pourrais être sourd, mais être capable de jouer les nocturnes de Chopin ne signifie pas que je peux créer de la musique comme Chopin.
Cependant, tous ceux qui ont regardé The Wandering Earth savent que MOSS a également évolué à partir de 550A ? Qui sait ce qui va se passer dans le futur ?
Si je ne vous le disais pas, comment sauriez-vous que la description du test de théorie de l'esprit a également été générée pour moi par chatGPT ?
Référence :
Il est confirmé que le modèle derrière ChatGPT a un esprit humain !
https://twitter.com/KevinAFischer/status/1623984337829117952
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!