Cet article est réimprimé avec l'autorisation d'AI New Media Qubits (ID de compte public : QbitAI). Veuillez contacter la source pour la réimpression.
La dernière approche de la recherche scientifique a été déverrouillée par un Chinois -
Dites à AI vos objectifs de recherche. , puis "alimentez" simplement l'ensemble de données et vous avez terminé.
Il s'agit de la dernière recherche menée par Zhong Ruiqi, un doctorant de Berkeley, et d'autres, qui ont confié le fastidieux processus de « collecte de preuves » à partir d'ensembles de données massifs à GPT-3 :
Ils ont également découvert que cette Cette méthode d'utilisation de l'IA pour la recherche scientifique est non seulement très efficace, mais peut également produire des « surprises inattendues » auxquelles les humains n'ont pas pensé.
Alors pourquoi ces gars-là veulent-ils soudainement faire de la recherche scientifique de cette manière ?
C'est parce qu'ils ont découvert que l'exploration en profondeur de grands corpus peut effectivement donner des résultats utiles, mais si ce processus est effectué par des humains, il prend tout simplement trop de temps et de main d'œuvre.
Par conséquent, ils ont décidé de confier ce processus fastidieux à GPT-3 et ont nommé cette tâche « D5 » :
Découverte guidée par un objectif des différences distributionnelles via des descriptions linguistiques.
Grâce à la description du langage, atteignez l'objectif Découverte guidée des différences distribuées .
Le processus de la tâche "D5" consiste simplement en deux actions :
Par exemple, dans le cas ci-dessus, le gars saisit d'abord les données à l'IA Deux corpus ont été saisis :
Déterminez ensuite votre objectif de recherche à l'IA, c'est-à-dire, "Je veux en savoir plus sur les effets secondaires du médicament A."
Après que l'IA ait reçu la tâche, elle a immédiatement commencé à effectuer un travail d'analyse, et est finalement arrivée à sa conclusion :
Pour les échantillons du corpus A, davantage de patients mentionneront « paranoïa ».
Mais imaginez, si les chercheurs humains sont autorisés à faire ce travail, il faudra beaucoup de temps rien que pour comprendre les corpus A et B, sans parler d'analyses comparatives plus approfondies et d'autres travaux.
La raison pour laquelle la mission D5 peut se dérouler si bien est que les gars ont fait beaucoup de travail en coulisses.
Par exemple, l'ensemble de métadonnées OpenD5 est construit, qui contient 675 questions ouvertes conformes aux tâches D5, couvrant des domaines tels que les affaires, les sciences sociales, les sciences humaines, la santé et l'apprentissage automatique.
Et chaque question ouverte correspond à un couple de corpus (Corpus A et Corpus B), avec une moyenne de 17 000 échantillons.
Le petit frère utilise également 50 % de chaque corpus comme partie recherche, et les 50 % restants sont utilisés pour la vérification.
Sur cette base, j'ai construit un « système D5 ». Son principe de fonctionnement est similaire à celui des humains obtenant des résultats à partir de la base de données. Il est divisé en deux étapes, c'est-à-dire proposer de manière créative une hypothèse puis la vérifier strictement sur l'ensemble de données. .Cette hypothèse.
Selon cette idée, les chercheurs ont ensuite mené une expérience utilisant GPT-3.
Ils ont d'abord montré à GPT3 les objectifs de recherche et quelques échantillons de chaque corpus, puis lui ont demandé de proposer une liste d'hypothèses.
L'expérience finale a révélé que GPT-3 peut utiliser des descriptions de cibles pour proposer des hypothèses plus pertinentes, nouvelles et significatives.
C'est aussi parce que l'ensemble de données OpenD5 couvre de nombreux domaines, j'ai donc dit que leur système D5 a les caractéristiques d'un large éventail d'applications.
Mais concernant ce système D5, le gars a aussi ouvertement évoqué ses défauts.
Par exemple, si le corpus contient beaucoup d'argot, de expressions familières ou de mots chargés d'émotions, alors les « découvertes » données par l'IA seront biaisées.
En bref, cela signifie que l'IA a une mauvaise compréhension et analyse du vocabulaire ou de la description d'une situation spécifique.
De plus, j'ai également dit qu'un corpus plus flexible et un système plus évolutif sont également au centre de leurs futures recherches.
Mais il semble que cette recherche me rende très excité. Après tout, c'est un pas de plus vers son rêve de "construire une recherche scientifique utilisant des manuscrits d'IA".
Lien de référence :
[1]https://www.php.cn/link/b1adda14824f50ef24ff1c05bb66faf3
[2]https://www.php .cn/link/ec26fc2eb2b75aece19c70392dc744c2
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!