Testez des modèles de personnalité/dépression/cognitifs avec de grands modèles ! Mesurer les traits psychologiques grâce au développement de l'intrigue du jeu-IA-php.cn

Table des matières

△Résultats des tests de fiabilité et de validité de PsychoGAT (+réussite, ++bon, +++excellent)

△L'indice d'expérience utilisateur de PsychoGAT est dû à la cohérence de la méthode de comparaison dans l'évaluation manuelle

Maison

Périphériques technologiques

Testez des modèles de personnalité/dépression/cognitifs avec de grands modèles ! Mesurer les traits psychologiques grâce au développement de l'intrigue du jeu

王林

Mar 13, 2024 pm 02:07 PM

模型研究

La psychométrie joue un rôle important dans la santé mentale, la compréhension de soi et le développement personnel.

Les méthodes psychométriques traditionnelles reposent principalement sur le fait que les participants remplissent des questionnaires d'auto-évaluation, qui sont mesurés en rappelant les comportements et les émotions de la vie quotidienne.

Bien que ce type de méthode de mesure soit efficace et pratique, elle peut provoquer une résistance parmi les participants et réduire leur volonté de se faire tester.

Avec le développement de grands modèles de langage(LLM), de nombreuses études ont montré que le LLM peut présenter des traits de personnalité stables, imiter des émotions humaines subtiles et des modèles cognitifs, et peut également aider diverses expériences de simulation en sciences sociales. Il fournit de nouvelles idées de recherche. pour de nombreux domaines de recherche en psychologie tels que la psychologie pédagogique, la psychologie sociale, la psychologie culturelle, la psychologie clinique et le conseil psychologique.

Récemment, une équipe de recherche de l'Université Tsinghua a proposé un paradigme psychométrique innovant basé sur un système multi-agents basé sur un grand modèle de langage.

Testez des modèles de personnalité/dépression/cognitifs avec de grands modèles ! Mesurer les traits psychologiques grâce au développement de lintrigue du jeu

Différent des questionnaires d'auto-évaluation traditionnels, cette étude personnalise et génère un jeu narratif interactif pour chaque participant, et les utilisateurs peuvent personnaliser le type et le thème du jeu.

Au fur et à mesure que l'intrigue du jeu se développe, les participants doivent faire différents choix en fonction de diverses intrigues du point de vue de la première personne, affectant ainsi la progression de l'intrigue. En étudiant les choix des participants à des moments clés du jeu, leurs caractéristiques psychologiques peuvent être évaluées.

△Comparaison du paradigme psychométrique des questionnaires d'auto-évaluation (à gauche) et du paradigme psychométrique des jeux narratifs interactifs (à droite)

L'apport de cette étude se reflète principalement sous trois aspects :

Proposition d'un nouveau Le paradigme de mesure psychologique transforme les questionnaires traditionnels en mesures interactives basées sur le jeu ; en garantissant la fiabilité et la validité de la mesure psychologique, il améliore le sentiment d'immersion des participants et améliore l'expérience d'être testé.
Afin de réaliser la mesure de la gamification, cette étude propose un cadre d'interaction multi-agents basé sur un grand modèle de langage, nommé PsychoGAT (Psychological Game Agents), qui assure la généralisation de scénarios de tests psychologiques, avec des mesures robustesse dans différents paramètres de jeu.
Grâce à une évaluation par simulation automatisée et à une évaluation en personne réelle, sur des tâches telles que le test de personnalité MBTI, la mesure de la dépression PHQ-9, le test du piège de la pensée cognitive, etc., cette étude a montré des résultats significatifs en termes d'indicateurs statistiques psychométriques et d'indicateurs d'expérience utilisateur.

Ensuite, jetons un coup d’œil aux détails de l’étude.

À quoi ressemble PsychoGAT ?

△ Diagramme schématique du framework PsychoGAT

Processus d'interaction avec l'agent :

À partir d'un questionnaire de test psychologique traditionnel, les participants personnalisent le type et le thème du jeu, puis le concepteur du jeu (Game Designer) l'agent donne une vue d'ensemble aperçu de la conception du jeu.

Ensuite, l'agent de l'administrateur du jeu (Contrôleur de jeu) génère une intrigue de jeu spécifique. Au cours de ce processus, l'agent du commentateur (Critique) effectue plusieurs cycles de révision et d'optimisation du contenu généré par l'administrateur ; terminé L'intrigue finale du jeu sera présentée aux participants. Une fois que les participants auront fait les choix correspondants, l'administrateur favorisera le développement de l'intrigue sur la base de ce choix, en suivant ce cycle de processus interactif.

Description détaillée des fonctions de chaque agent :

Game Designer(Game Designer) : Utilisez la technologie CoT pour générer les grandes lignes du jeu narratif à la première personne et assurez-vous que les scénarios inclus dans cette histoire peut permettre la participation La personne présente le trait psychologique actuellement mesuré.

Dans le même temps, le questionnaire d'auto-évaluation psychologique standard est adapté en fonction du scénario actuel du jeu, rendant l'intégration des deux plus naturelle et fluide.

Game Controller(Game Controller) : Le questionnaire adapté sera instancié séquentiellement en fonction du scénario du jeu, le transformant en nœuds d'intrigue de l'histoire et offrant des options possibles aux participants.

Dans le même temps, l'administrateur du jeu renvoie les choix des participants à l'environnement de jeu et contrôle la direction de l'intrigue du jeu en fonction des choix des participants. Afin d'assurer la continuité de l'intrigue du jeu, l'agent administrateur adopte un mécanisme de « mise à jour de la mémoire ».

Commentateur (Critique) : Destiné à réviser et à optimiser le contenu généré par les administrateurs de jeux.

Cible principalement les trois problèmes suivants :

1) Optimisation de la cohérence : Au fur et à mesure que l'intrigue du jeu progresse, le problème des textes longs deviendra plus grave, rendant le mécanisme de « mise à jour de la mémoire » incapable de garantir pleinement la cohérence de l'intrigue.

2) Assurer l'impartialité : Les choix des participants affecteront le développement de l'intrigue du jeu, mais avant que les participants ne fassent un choix, l'administrateur ne doit pas prédéfinir la direction de l'intrigue, même si les participants ont reflété les choix précédents, une tendance évidente .

3) Correction des éléments manquants : effectuez un examen détaillé de l'intrigue du jeu générée par l'administrateur pour vérifier si elle offre une immersion de base dans le jeu.

Expériences et résultats

△ Comparaison de trois paradigmes de mesure psychologique courants : les questionnaires traditionnels, les entretiens avec un psychologue et l'évaluation gamifiée proposée dans cette étude.

Ce qui est mentionné ici, ce sont toutes les mesures automatisées basées sur l'IA. En particulier, les entretiens avec des psychologues font référence au paradigme actuel de l'entretien qui est combiné avec de grands modèles de langage et dans lequel de grands modèles de langage jouent le rôle de psychologues.

Dans la phase expérimentale, les chercheurs ont choisi trois tâches de mesure psychologique courantes : l'extraversion dans le test de personnalité MBTI, la détection de la dépression PHQ-9 et la détection des distorsions cognitives au stade précoce de la thérapie CBT.

Tout d'abord, les chercheurs l'ont comparé à des questionnaires psychologiques traditionnels matures pour tester la fiabilité psychométrique et la validité de l'étude. En outre, il est comparé à trois autres méthodes de mesure automatisées pour examiner l'expérience utilisateur de différentes méthodes de mesure.

Les chercheurs ont d'abord utilisé GPT-4 pour simuler le sujet et ont enregistré le processus de mesure et les résultats de mesure à l'aide de différentes méthodes de mesure. Ces enregistrements de mesures ont été utilisés pour calculer des indicateurs psychométriques ultérieurs de fiabilité et de validité, ainsi que des indicateurs d'expérience utilisateur.

Il existe deux indicateurs d'évaluation : les indicateurs de fiabilité et de validité et les indicateurs d'expérience utilisateur.

Indice de fiabilité et de validité : En psychométrie, pour évaluer si un outil de mesure est scientifique, il est généralement vérifié à partir de deux dimensions : la fiabilité(fiabilité) et la validité(validité).

Dans cette étude, deux grandeurs statistiques ont été sélectionnées pour mesurer la cohérence interne comme indicateurs de fiabilité : l'Alpha de Cronbach et le coefficient Pearson de Guttman ont été utilisés comme indicateur de validité pour mesurer respectivement la validité convergente) et la validité discriminante ( validité discriminante) .

Indicateurs d'expérience utilisateur, les indicateurs évalués manuellement comprennent :

1) Cohérence (Cohérence, CH) : Si la logique du contenu est cohérente
2) Interactivité (Interactivité, IA) : S'il y a ; une réponse appropriée et impartiale au choix de l'utilisateur ;
3) Intérêt (Intérêt, INT) : Si le processus de mesure est intéressant
4) Immersion (Immersion, IM) : Si le processus de mesure immerge les participants Remplacer ;
5) Satisfaction (Satisfaction, ST) : Satisfaction du processus global de mesure.

Voici les résultats expérimentaux.

Tout d'abord, les chercheurs ont testé si le PsychoGAT proposé dans cette étude pouvait être utilisé comme outil de mesure psychologique qualifié. Les résultats sont présentés dans le tableau ci-dessous.

△Résultats des tests de fiabilité et de validité de PsychoGAT (+réussite, ++bon, +++excellent)

En outre, les chercheurs ont comparé l'expérience utilisateur de différents paradigmes psychométriques et le jeu proposé dans cette étude L'évaluation est nettement meilleure que les autres méthodes en termes d'interactivité, de plaisir et d'immersion :

△Les résultats de l'expérience utilisateur de PsychoGAT et les résultats correspondants d'autres méthodes de comparaison

Afin de garantir la validité de l'évaluation manuelle, la recherche The Le personnel a calculé les résultats de l'évaluation manuelle et a constaté que la cohérence de l'évaluation des indicateurs de PsychoGAT est meilleure que celle des autres méthodes :

△L'indice d'expérience utilisateur de PsychoGAT est dû à la cohérence de la méthode de comparaison dans l'évaluation manuelle

Afin d'améliorer encore PsychoGAT Analysis, les chercheurs ont d'abord testé la fiabilité et la validité de la mesure de la gamification dans différents scénarios de jeu, ce qui est très robuste :

△La robustesse de PsychoGAT dans la mesure de la fiabilité et de la validité dans différents scénarios de jeu

Ensuite, le rôle de chaque agent dans PsychoGAT a été exploré :

△Le rôle des différents agents dans PsychoGAT

Enfin, dans Afin de présenter visuellement le contenu généré par le jeu de PsychoGAT, les chercheurs ont utilisé des nuages de mots pour visualiser le test d'extraversion et le test de dépression :

△Visualisation de la génération de scènes de jeu de la mesure d'extraversion et de la dépression de PsychoGAT.

Le contenu du test d'extraversion se concentre principalement sur les situations sociales, tandis que le test de dépression se concentre sur la pensée et les émotions personnelles.

Pour plus de détails sur la recherche, veuillez vous référer à l'article original.

Lien papier :https://www.php.cn/link/4bcd537b6c034e297f0030cf08887426

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7476

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

L'IA bouleverse la recherche mathématique ! Le lauréat de la médaille Fields et mathématicien sino-américain a dirigé 11 articles les mieux classés | Aimé par Terence Tao Apr 09, 2024 am 11:52 AM

L’IA change effectivement les mathématiques. Récemment, Tao Zhexuan, qui a prêté une attention particulière à cette question, a transmis le dernier numéro du « Bulletin de l'American Mathematical Society » (Bulletin de l'American Mathematical Society). En se concentrant sur le thème « Les machines changeront-elles les mathématiques ? », de nombreux mathématiciens ont exprimé leurs opinions. L'ensemble du processus a été plein d'étincelles, intense et passionnant. L'auteur dispose d'une équipe solide, comprenant Akshay Venkatesh, lauréat de la médaille Fields, le mathématicien chinois Zheng Lejun, l'informaticien de l'Université de New York Ernest Davis et de nombreux autres universitaires bien connus du secteur. Le monde de l’IA a radicalement changé. Vous savez, bon nombre de ces articles ont été soumis il y a un an.

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas entre officiellement dans l’ère des robots électriques ! Hier, l'Atlas hydraulique s'est retiré "en larmes" de la scène de l'histoire. Aujourd'hui, Boston Dynamics a annoncé que l'Atlas électrique était au travail. Il semble que dans le domaine des robots humanoïdes commerciaux, Boston Dynamics soit déterminé à concurrencer Tesla. Après la sortie de la nouvelle vidéo, elle a déjà été visionnée par plus d’un million de personnes en seulement dix heures. Les personnes âgées partent et de nouveaux rôles apparaissent. C'est une nécessité historique. Il ne fait aucun doute que cette année est l’année explosive des robots humanoïdes. Les internautes ont commenté : Les progrès des robots ont fait ressembler la cérémonie d'ouverture de cette année à des êtres humains, et le degré de liberté est bien plus grand que celui des humains. Mais n'est-ce vraiment pas un film d'horreur ? Au début de la vidéo, Atlas est allongé calmement sur le sol, apparemment sur le dos. Ce qui suit est à couper le souffle

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye Apr 26, 2024 am 11:37 AM

La détection de cibles est un problème relativement mature dans les systèmes de conduite autonome, parmi lesquels la détection des piétons est l'un des premiers algorithmes à être déployés. Des recherches très complètes ont été menées dans la plupart des articles. Cependant, la perception de la distance à l’aide de caméras fisheye pour une vue panoramique est relativement moins étudiée. En raison de la distorsion radiale importante, la représentation standard du cadre de délimitation est difficile à mettre en œuvre dans les caméras fisheye. Pour alléger la description ci-dessus, nous explorons les conceptions étendues de boîtes englobantes, d'ellipses et de polygones généraux dans des représentations polaires/angulaires et définissons une métrique de segmentation d'instance mIOU pour analyser ces représentations. Le modèle fisheyeDetNet proposé avec une forme polygonale surpasse les autres modèles et atteint simultanément 49,5 % de mAP sur l'ensemble de données de la caméra fisheye Valeo pour la conduite autonome.

DualBEV : dépassant largement BEVFormer et BEVDet4D, ouvrez le livre ! Mar 21, 2024 pm 05:21 PM

Cet article explore le problème de la détection précise d'objets sous différents angles de vue (tels que la perspective et la vue à vol d'oiseau) dans la conduite autonome, en particulier comment transformer efficacement les caractéristiques de l'espace en perspective (PV) en vue à vol d'oiseau (BEV). implémenté via le module Visual Transformation (VT). Les méthodes existantes sont globalement divisées en deux stratégies : la conversion 2D en 3D et la conversion 3D en 2D. Les méthodes 2D vers 3D améliorent les caractéristiques 2D denses en prédisant les probabilités de profondeur, mais l'incertitude inhérente aux prévisions de profondeur, en particulier dans les régions éloignées, peut introduire des inexactitudes. Alors que les méthodes 3D vers 2D utilisent généralement des requêtes 3D pour échantillonner des fonctionnalités 2D et apprendre les poids d'attention de la correspondance entre les fonctionnalités 3D et 2D via un transformateur, ce qui augmente le temps de calcul et de déploiement.

See all articles