Ce n'est vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas-IA-php.cn

Table des matières

Nous ne comprenons même pas pourquoi ChatGPT est si populaire" >Nous ne comprenons même pas pourquoi ChatGPT est si populaire

Processus de réglage fin" >Processus de réglage fin

Prêt à être publié

Commentaires après le lancement

Maison

Périphériques technologiques

Ce n'est vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 11, 2023 pm 09:34 PM

ai 模型

Cette entreprise a fabriqué un produit qui pourrait déclencher la quatrième révolution industrielle, mais elle est perplexe : pourquoi ses produits sont-ils si populaires ?

Ce n’est vraiment pas Versailles.

Récemment, MIT Technology Review a interviewé plusieurs développeurs de ChatGPT, nous donnant un aperçu plus approfondi de l'histoire de ce produit d'IA populaire.

C'est si populaire qu'il n'y a aucune défense du tout

Lorsque OpenAI a discrètement lancé ChatGPT fin novembre 2022, la startup n'avait pas de grandes attentes.

Les employés d'OpenAI n'auraient jamais pensé que leur modèle serait en passe de devenir un modèle de premier ordre.

ChatGPT semble être devenu populaire du jour au lendemain, déclenchant une ruée vers l'or mondiale pour les grands modèles de langage. Cependant, OpenAI n'est pas du tout préparé et ne peut que se précipiter pour rattraper ses meilleurs modèles et tenter de saisir l'opportunité commerciale. .

Sandhini Agarwal, qui travaille sur les politiques chez OpenAI, a déclaré qu'au sein d'OpenAI, ChatGPT a toujours été considéré comme un « aperçu de la recherche » - il s'agit d'une version plus complète de la technologie vieille de deux ans, et plus important encore, l’entreprise essaie de transmettre les commentaires du public pour éliminer certaines des lacunes du modèle.

Qui aurait pensé qu'un tel produit « avant-première » deviendrait populaire après ses débuts par accident.

Les scientifiques d'OpenAI sont très confus à ce sujet, et ils sont également très conscients des fleurs et des applaudissements du monde extérieur.

"Nous ne voulons pas exagérer cela en le considérant comme un énorme progrès fondamental", a déclaré Liam Fedus, un scientifique d'OpenAI qui a participé au développement de ChatGPT.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

Parmi les membres de l'équipe ChatGPT, 5 ont été nommés AI 2000 Global Artificial Intelligence Scholars en 2023

Pour cette raison, le journaliste du MIT Technology Review, Will Douglas Heaven, a interviewé la coentreprise de John Schulman, fondateur d'OpenAI, les développeurs Agarwal et Fedus et le chef de l'équipe d'alignement Jan Leike.

Nous ne comprenons même pas pourquoi ChatGPT est si populaire

Le fondateur John Schulman a déclaré que quelques jours après la sortie de ChatGPT, il consultait Twitter de temps en temps. Il y a eu une période folle où le fil Twitter était rempli de captures d'écran de ChatGPT.

Il pensait que c'était un produit très intuitif pour les utilisateurs et qu'il aurait quelques fans, mais il ne s'attendait pas à ce qu'il devienne si courant.

Jan Leike a déclaré que tout était si soudain et que tout le monde était surpris et s'efforçait de suivre la popularité de ChatGPT. Il était curieux de savoir ce qui était à l’origine de sa popularité croissante. Y avait-il quelqu’un dans les coulisses ? Après tout, OpenAI lui-même ne comprend pas pourquoi ChatGPT est si populaire.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

Liam Fedus a expliqué pourquoi ils étaient si surpris, car ChatGPT n'est pas le premier chatbot à usage général, et beaucoup de gens l'ont déjà essayé, donc Liam Fedus estime que leurs chances ne sont pas grandes. Cependant, la version bêta privée lui a également donné confiance - peut-être que ce A est quelque chose que les utilisateurs apprécieront vraiment.

Sandhini Agarwal a conclu que le succès instantané de ChatGPT a été une surprise pour tout le monde. Tant de travail a été réalisé sur ces modèles qu’on oublie à quel point ils sont étonnants pour le grand public extérieur à l’entreprise.

En effet, la plupart des technologies au sein de ChatGPT ne sont pas nouvelles. Il s'agit d'une version affinée de GPT-3.5, publiée par OpenAI quelques mois avant ChatGPT. GPT-3.5 lui-même est une version mise à jour de GPT-3, apparue en 2020.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

L'équipe ChatGPT a participé aux sept précédents numéros majeurs de R&D technologique

Sur le site Web, OpenAI fournit ces modèles sous forme d'interfaces de programmation d'applications ou d'API, et d'autres développeurs peuvent facilement insérer les modèles dans votre propre code.

En janvier 2022, OpenAI a également publié InstructGPT, une précédente version affinée de GPT-3.5. Cependant, ces technologies ne sont pas promues auprès du public.

Processus de réglage fin

Selon l'introduction de Liam Fedus, le modèle ChatGPT est affiné à partir du même modèle de langage qu'InstructGPT, et la méthode de réglage fin utilisée est similaire. Les chercheurs ont ajouté quelques données de conversation et apporté quelques ajustements au processus de formation. Ils ne veulent donc pas exagérer cela en le considérant comme une énorme avancée fondamentale.

Il s'avère que ce qui joue un rôle important dans ChatGPT, ce sont les données de conversation.

Selon l'évaluation des benchmarks standards, il n'y a en fait pas de grande différence dans les capacités techniques brutes entre les deux modèles. La plus grande différence entre ChatGPT est qu'il est plus facile à obtenir et à utiliser.

Jan Leike a expliqué que dans un sens, ChatGPT peut être compris comme une version du système d'IA qu'OpenAI possède depuis un certain temps. ChatGPT n'est pas plus performant. Le même modèle de base était utilisé sur l'API depuis près d'un an avant la sortie de ChatGPT.

Les améliorations apportées par les chercheurs peuvent se résumer à, dans un sens, le rendre plus conforme à l'utilisation que les humains souhaitent en faire. Il parle à l'utilisateur dans une conversation, constitue une interface de chat et est facilement accessible. Cela facilite la déduction de l'intention et les utilisateurs peuvent expérimenter d'avant en arrière pour obtenir ce qu'ils veulent.

Le secret réside dans la technologie d'apprentissage par renforcement avec feedback humain (RLHF), qui est très similaire à la méthode de formation d'InstructGPT - lui apprenant ce que les utilisateurs humains aiment réellement.

Jan Leike a déclaré avoir demandé à un grand groupe de personnes de lire les invites et les réponses de ChatGPT, puis de choisir l'une des deux réponses pour voir quelle réponse tout le monde pensait être la meilleure. Ensuite, toutes ces données sont combinées en une seule session de formation.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

La plupart sont les mêmes que ce qu'ils font sur InstructGPT. Comme si vous espériez que c'est utile, vous espérez que c'est vrai, vous espérez que ce n'est pas vicieux.

Il y a aussi quelques détails. Par exemple, si la requête de l'utilisateur n'est pas claire, il doit poser des questions de suivi pour l'affiner. Il devrait également préciser qu’il s’agit d’un système d’intelligence artificielle et qu’il ne doit pas assumer une identité qu’il n’a pas ni prétendre avoir des capacités qu’il ne possède pas. Lorsque l’utilisateur lui demande d’effectuer une tâche qu’il n’est pas censé faire, il doit explicitement refuser.

C'est-à-dire qu'il existe une liste de divers critères dont disposent les évaluateurs humains pour classer les modèles, tels que l'authenticité. Mais ils préféreront aussi certaines pratiques, comme l’IA qui ne prétend pas être humaine.

Prêt à être publié

En général, ChatGPT utilise des technologies qu'OpenAI a déjà utilisées, l'équipe n'a donc rien fait de spécial lors de la préparation de la publication de ce modèle au public. Selon eux, les normes fixées pour les modèles précédents étaient suffisantes et GPT-3.5 était suffisamment sécurisé.

Dans la formation des préférences humaines de ChatGPT, il a appris par lui-même le comportement de rejet et a rejeté de nombreuses demandes.

OpenAI a rassemblé quelques « chanteurs » pour ChatGPT : tout le monde dans l'entreprise s'est assis et a essayé de casser le modèle. Il existe également des groupes extérieurs qui font la même chose. Les premiers utilisateurs de confiance fournissent également des commentaires.

Sandhini Agarwal a déclaré avoir constaté que cela produisait des résultats indésirables, mais ce sont des choses que GPT-3.5 produit également. Par conséquent, si l’on examine uniquement les risques, ChatGPT constitue un « aperçu de recherche » suffisant.

John Schulman a également déclaré qu'il est impossible d'attendre qu'un système soit parfait à 100% avant de le publier. Ils testent les premières versions bêta depuis plusieurs mois et les bêta-testeurs ont été très impressionnés par ChatGPT.

Ce qui inquiète le plus OpenAI, ce sont en fait les problèmes factuels, car ChatGPT aime trop fabriquer des choses. Mais ces problèmes existent dans InstructGPT et d’autres grands modèles de langage, donc aux yeux des chercheurs, tant que ChatGPT est meilleur que ces modèles en termes de factualité et d’autres problèmes de sécurité, c’est suffisant.

Et sur la base d'une évaluation limitée, avant la sortie, il peut être confirmé que ChatGPT est plus réaliste et plus sécurisé que les autres modèles, c'est pourquoi OpenAI a décidé de poursuivre la sortie.

Commentaires après le lancement

Après la sortie de ChatGPT, OpenAI a observé comment les utilisateurs l'utilisent.

Un grand modèle de langage est placé entre les mains de dizaines de millions d'utilisateurs. C'est la première fois dans l'histoire.

Les utilisateurs deviennent également fous et veulent tester les limites de ChatGPT et où se trouvent les bugs.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

La popularité de ChaatGPT a également fait émerger de nombreux problèmes, tels que des problèmes de biais et des problèmes induits par les invites.

Jan Leike a déclaré que certaines des choses qui sont devenues virales sur Twitter ont en fait été discrètement prises en charge par OpenAI.

Par exemple, le problème du jailbreak est définitivement quelque chose qu'ils doivent résoudre. Les utilisateurs aiment simplement essayer de faire dire de mauvaises choses au modèle à travers quelques rebondissements. Cela correspond aux attentes d'OpenAI et c'est également la seule voie à suivre.

Lorsque des jailbreaks seront découverts, OpenAI ajoutera ces conditions aux données de formation et de test, et toutes les données seront incorporées dans les futurs modèles.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

Jan Leike a déclaré que chaque fois qu'il y aurait un meilleur modèle, ils voudront le sortir et le tester.

Ils sont très optimistes quant au fait qu'une formation contradictoire ciblée peut grandement améliorer la situation du jailbreak. Même s'il n'est pas clair si ces problèmes disparaîtront complètement, ils pensent qu'ils peuvent rendre difficiles de nombreux jailbreaks.

Quand un système « fait officiellement ses débuts », il est difficile de prévoir tout ce qui va réellement se passer.

Ils peuvent donc uniquement se concentrer sur la surveillance de la raison pour laquelle les gens utilisent le système, voir ce qui se passe, puis réagir en conséquence.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

Maintenant, Microsoft a lancé Bing Chat, que beaucoup de gens pensent être une version du GPT-4 officiellement inopiné d'OpenAI.

Partant de cette prémisse, Sandhini Agarwal a déclaré que le niveau auquel ils sont confrontés aujourd'hui est certainement beaucoup plus élevé qu'il y a six mois, mais toujours inférieur au niveau d'un an plus tard.

Le contexte dans lequel ces modèles sont utilisés est extrêmement important.

Pour les grandes entreprises comme Google et Microsoft, même si une chose n'est pas vraie, cela devient un énorme problème car elles sont elles-mêmes des moteurs de recherche.

Ce nest vraiment pas Versailles ! ChatGPT a tellement de succès que même OpenAI ne le comprend pas

Paul Buchheit, le 23ème employé de Google, qui a créé Gmail, a une attitude pessimiste envers Google

En tant que grand modèle de langage pour un moteur de recherche, il est complètement différent d'un chatbot juste pour le plaisir. Les chercheurs d’OpenAI travaillent également dur pour comprendre comment passer d’une utilisation à l’autre et créer quelque chose de vraiment utile aux utilisateurs.

John Schulman a admis qu'OpenAI avait sous-estimé à quel point les gens se soucient des questions politiques dans ChatGPT. À cette fin, ils espèrent prendre de meilleures décisions lors de la collecte de données sur la formation afin de réduire les problèmes dans ce domaine.

Jan Leike a déclaré que de son propre point de vue, ChatGPT échoue souvent. Il y a tellement de problèmes à résoudre, mais OpenAI ne les résout pas. Cela, a-t-il admis franchement.

Bien que les modèles linguistiques existent depuis un certain temps, ils en sont encore à leurs débuts.

Ensuite, il y a encore d'autres choses qu'OpenAI doit faire.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7489

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

phpmyadmin crée un tableau de données Apr 10, 2025 pm 11:00 PM

Pour créer un tableau de données à l'aide de PhpMyAdmin, les étapes suivantes sont essentielles: connectez-vous à la base de données et cliquez sur le nouvel onglet. Nommez le tableau et sélectionnez le moteur de stockage (InnODB recommandé). Ajouter les détails de la colonne en cliquant sur le bouton Ajouter une colonne, y compris le nom de la colonne, le type de données, s'il faut autoriser les valeurs nuls et d'autres propriétés. Sélectionnez une ou plusieurs colonnes comme clés principales. Cliquez sur le bouton Enregistrer pour créer des tables et des colonnes.

Comment créer une base de données Oracle Comment créer une base de données Oracle Apr 11, 2025 pm 02:33 PM

La création d'une base de données Oracle n'est pas facile, vous devez comprendre le mécanisme sous-jacent. 1. Vous devez comprendre les concepts de la base de données et des SGBD Oracle; 2. Master les concepts de base tels que SID, CDB (base de données de conteneurs), PDB (base de données enfichable); 3. Utilisez SQL * Plus pour créer CDB, puis créer PDB, vous devez spécifier des paramètres tels que la taille, le nombre de fichiers de données et les chemins; 4. Les applications avancées doivent ajuster le jeu de caractères, la mémoire et d'autres paramètres et effectuer un réglage des performances; 5. Faites attention à l'espace disque, aux autorisations et aux paramètres des paramètres, et surveillez et optimisez en continu les performances de la base de données. Ce n'est qu'en le maîtrisant habilement une pratique continue que vous pouvez vraiment comprendre la création et la gestion des bases de données Oracle.

Comment créer une base de données Oracle Comment créer une base de données Oracle Apr 11, 2025 pm 02:36 PM

Pour créer une base de données Oracle, la méthode commune consiste à utiliser l'outil graphique DBCA. Les étapes sont les suivantes: 1. Utilisez l'outil DBCA pour définir le nom DBN pour spécifier le nom de la base de données; 2. Définissez Syspassword et SystemPassword sur des mots de passe forts; 3. Définir les caractères et NationalCharacterset à Al32Utf8; 4. Définissez la taille de mémoire et les espaces de table pour s'ajuster en fonction des besoins réels; 5. Spécifiez le chemin du fichier log. Les méthodes avancées sont créées manuellement à l'aide de commandes SQL, mais sont plus complexes et sujets aux erreurs. Faites attention à la force du mot de passe, à la sélection du jeu de caractères, à la taille et à la mémoire de l'espace de table

Comment rédiger des instructions de base de données Oracle Apr 11, 2025 pm 02:42 PM

Le cœur des instructions Oracle SQL est sélectionné, insérer, mettre à jour et supprimer, ainsi que l'application flexible de diverses clauses. Il est crucial de comprendre le mécanisme d'exécution derrière l'instruction, tel que l'optimisation de l'indice. Les usages avancés comprennent des sous-requêtes, des requêtes de connexion, des fonctions d'analyse et PL / SQL. Les erreurs courantes incluent les erreurs de syntaxe, les problèmes de performances et les problèmes de cohérence des données. Les meilleures pratiques d'optimisation des performances impliquent d'utiliser des index appropriés, d'éviter la sélection *, d'optimiser les clauses et d'utiliser des variables liées. La maîtrise d'Oracle SQL nécessite de la pratique, y compris l'écriture de code, le débogage, la réflexion et la compréhension des mécanismes sous-jacents.

Comment ajouter, modifier et supprimer le guide de fonctionnement du champ de table de données MySQL Apr 11, 2025 pm 05:42 PM

Guide de fonctionnement du champ dans MySQL: Ajouter, modifier et supprimer les champs. Ajouter un champ: alter table table_name Ajouter Column_name data_type [pas null] [Default default_value] [Clé primaire] [Auto_increment] Modifier le champ: alter table table_name modifie Column_name data_type [pas null] [default default_value] [clé primaire]

Quelles sont les contraintes d'intégrité des tables de base de données Oracle? Apr 11, 2025 pm 03:42 PM

Les contraintes d'intégrité des bases de données Oracle peuvent garantir la précision des données, notamment: Not Null: les valeurs nulles sont interdites; Unique: garantie l'unicité, permettant une seule valeur nulle; Clé primaire: contrainte de clé primaire, renforcer unique et interdire les valeurs nulles; Clé étrangère: maintenir les relations entre les tableaux, les clés étrangères se réfèrent aux clés primaires primaires; Vérifiez: limitez les valeurs de colonne en fonction des conditions.

Explication détaillée des instances de requête imbriquées dans la base de données MySQL Apr 11, 2025 pm 05:48 PM

Les requêtes imbriquées sont un moyen d'inclure une autre requête dans une requête. Ils sont principalement utilisés pour récupérer des données qui remplissent des conditions complexes, associer plusieurs tables et calculer des valeurs de résumé ou des informations statistiques. Les exemples incluent la recherche de salaires supérieurs aux employés, la recherche de commandes pour une catégorie spécifique et le calcul du volume des commandes totales pour chaque produit. Lorsque vous écrivez des requêtes imbriquées, vous devez suivre: écrire des sous-requêtes, écrire leurs résultats sur les requêtes extérieures (référencées avec des alias ou en tant que clauses) et optimiser les performances de la requête (en utilisant des index).

Comment les journaux Tomcat aident à dépanner les fuites de mémoire Apr 12, 2025 pm 11:42 PM

Les journaux TomCat sont la clé pour diagnostiquer les problèmes de fuite de mémoire. En analysant les journaux TomCat, vous pouvez avoir un aperçu de l'utilisation de la mémoire et du comportement de collecte des ordures (GC), localiser et résoudre efficacement les fuites de mémoire. Voici comment dépanner les fuites de mémoire à l'aide des journaux Tomcat: 1. Analyse des journaux GC d'abord, activez d'abord la journalisation GC détaillée. Ajoutez les options JVM suivantes aux paramètres de démarrage TomCat: -xx: printgcdetails-xx: printgcdatestamps-xloggc: gc.log Ces paramètres généreront un journal GC détaillé (GC.Log), y compris des informations telles que le type GC, la taille et le temps des objets de recyclage. Analyse GC.Log

See all articles