Maison Périphériques technologiques IA Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Apr 24, 2023 pm 04:04 PM
chatgpt 论文

Après que ChatGPT soit devenu populaire, de nombreux étudiants attentifs à la technologie se posent une question : existe-t-il du matériel d'apprentissage qui peut nous permettre de comprendre systématiquement les principes qui se cachent derrière ChatGPT ? Ce problème devient délicat car OpenAI n'a pas publié d'article relatif à ChatGPT.

Cependant, nous savons grâce au blog d'OpenAI sur ChatGPT que la méthode utilisée par ChatGPT est la même que son modèle frère InstructGPT, sauf qu'InstructGPT est affiné sur GPT-3, tandis que ChatGPT est basé sur GPT- 3.5. Il existe également quelques différences entre les deux en termes de collecte de données. L'article d'InstructGPT a été publié en mars 2022, mais OpenAI a publié des articles connexes dès le blog de janvier (voir « Que faire si GPT-3 est du charabia ? OpenAI : nous l'avons recyclé, et la nouvelle version est plus « obéissante » »). À cette époque, OpenAI a clairement mentionné qu'InstructGPT utilisait la méthode d'apprentissage par renforcement par rétroaction humaine (RLHF) pour affiner GPT-3, rendant le résultat du modèle plus cohérent avec les préférences humaines. Cela s'est poursuivi dans la formation de ChatGPT.

Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Lien papier : https://arxiv.org/pdf/2203.02155.pdf

De plus, il existe de nombreuses similitudes entre InstructGPT et ChatGPT. Par conséquent, une compréhension approfondie du document InstructGPT sera d'un grand avantage pour les étudiants qui souhaitent travailler dans le sens de ChatGPT. C'est pourquoi nous recommandons fortement les conférences de Li Mu.

Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Adresse du cours : https://jmq.xet.tech/s/2lec6b (Cliquez sur "Lire le texte original" pour y aller directement)

Le Dr Li Mu est le senior scientifique en chef d'Amazon, il a auparavant co-écrit "Hands-on Deep Learning" avec Aston Zhang et d'autres. Au cours des deux dernières années, il a présenté à tous diverses connaissances en matière d'IA à travers des vidéos et a produit des cours de lecture intensifs sur des dizaines d'articles. De nombreux étudiants ont pris l'habitude de suivre Li Mu dans la lecture intensive des articles.

Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPTLe compte du Dr Li Mu sur Station B est « Apprenez l'IA de Li Mu ».

Ce cours d'interprétation pour InstructGPT dure un total de 67 minutes et est essentiellement présenté dans l'ordre de rédaction de l'article.

Les étudiants qui ont lu le blog ChatGPT savent que ses principes techniques peuvent essentiellement être résumés par une image, qui est également une image qui est apparue dans l'article InstructGPT (il existe des différences subtiles entre les deux) . Lors de l'interprétation du résumé et de l'introduction de l'article, Li Mu a présenté en détail les trois étapes du diagramme.

Schémas techniques du blog ChatGPT.

Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Schémas techniques de l'article InstructGPT. Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Dans le troisième chapitre de l'article, les auteurs d'InstructGPT ont d'abord présenté leur méthode et leur processus d'acquisition de données, et Li Mu a également amené tout le monde à le lire en détail. Cette pièce est très précieuse en ingénierie. Comme Li Mu l'a dit, si vous n'avez jamais fait quelque chose de tel auparavant (étiquetage des données, etc.) et que vous avez besoin de trouver quelqu'un pour vous aider à étiqueter les données, vous pouvez consulter son annexe, qui contient de nombreux modèles pouvant être utilisés directement. L'auteur de l'article décrit même à quoi ressemble l'interface utilisateur de son site Web annoté, ce qui mérite d'être appris.

Ensuite, Li Mu s'est concentré sur les trois modèles écrits au chapitre 3 (voir 3.5 Modèles) - le modèle SFT (réglage fin supervisé), le modèle RM (modélisation de récompense) et le modèle RL (apprentissage par renforcement), y compris ces modèles impliquent des détails tels que comme paramètres et fonctions objectifs.

Enfin, Li Mu a conclu que techniquement parlant, InstructGPT est toujours une technologie très pratique. Il indique à chacun une méthode : étant donné un modèle de langage volumineux, comment pouvez-vous améliorer rapidement ses performances dans un domaine qui vous tient à cœur grâce à des données annotées pour le rendre pratique. Il fournit donc une idée opérationnelle aux personnes souhaitant utiliser des modèles génératifs pour fabriquer des produits.

Bien sûr, comme l'a dit le Dr Li Mu, les travaux de recherche scientifique sont progressifs et InstructGPT est également basé sur des recherches antérieures, donc les étudiants qui souhaitent bien comprendre ChatGPT devront inévitablement revenir en arrière et lire plus d'articles. Dans les cours précédents, Li Mu a également interprété en détail les articles de GPT, GPT-2 et GPT-3 :

Apprenez rapidement les points techniques clés du document InstructGPT : suivez Li Mu pour maîtriser la technologie derrière ChatGPT

Adresse du cours : https://jmq.xet.tech/s/2lec6b

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne Aug 09, 2024 pm 09:37 PM

Le DALL-E 3 a été officiellement introduit en septembre 2023 en tant que modèle considérablement amélioré par rapport à son prédécesseur. Il est considéré comme l’un des meilleurs générateurs d’images IA à ce jour, capable de créer des images avec des détails complexes. Cependant, au lancement, c'était exclu

Le papier Stable Diffusion 3 est enfin publié, et les détails architecturaux sont révélés. Cela aidera-t-il à reproduire Sora ? Le papier Stable Diffusion 3 est enfin publié, et les détails architecturaux sont révélés. Cela aidera-t-il à reproduire Sora ? Mar 06, 2024 pm 05:34 PM

L'article de StableDiffusion3 est enfin là ! Ce modèle est sorti il ​​y a deux semaines et utilise la même architecture DiT (DiffusionTransformer) que Sora. Il a fait beaucoup de bruit dès sa sortie. Par rapport à la version précédente, la qualité des images générées par StableDiffusion3 a été considérablement améliorée. Il prend désormais en charge les invites multithèmes, et l'effet d'écriture de texte a également été amélioré et les caractères tronqués n'apparaissent plus. StabilityAI a souligné que StableDiffusion3 est une série de modèles avec des tailles de paramètres allant de 800M à 8B. Cette plage de paramètres signifie que le modèle peut être exécuté directement sur de nombreux appareils portables, réduisant ainsi considérablement l'utilisation de l'IA.

La combinaison parfaite de ChatGPT et Python : créer un chatbot de service client intelligent La combinaison parfaite de ChatGPT et Python : créer un chatbot de service client intelligent Oct 27, 2023 pm 06:00 PM

La combinaison parfaite de ChatGPT et Python : Création d'un chatbot de service client intelligent Introduction : À l'ère de l'information d'aujourd'hui, les systèmes de service client intelligents sont devenus un outil de communication important entre les entreprises et les clients. Afin d'offrir une meilleure expérience de service client, de nombreuses entreprises ont commencé à se tourner vers les chatbots pour effectuer des tâches telles que la consultation des clients et la réponse aux questions. Dans cet article, nous présenterons comment utiliser le puissant modèle ChatGPT et le langage Python d'OpenAI pour créer un chatbot de service client intelligent afin d'améliorer

Comment installer chatgpt sur un téléphone mobile Comment installer chatgpt sur un téléphone mobile Mar 05, 2024 pm 02:31 PM

Étapes d'installation : 1. Téléchargez le logiciel ChatGTP depuis le site officiel ou la boutique mobile de ChatGTP ; 2. Après l'avoir ouvert, dans l'interface des paramètres, sélectionnez la langue chinoise 3. Dans l'interface de jeu, sélectionnez le jeu homme-machine et définissez la langue. Spectre chinois ; 4. Après avoir démarré, entrez les commandes dans la fenêtre de discussion pour interagir avec le logiciel.

NeRF et le passé et le présent de la conduite autonome, résumé de près de 10 articles ! NeRF et le passé et le présent de la conduite autonome, résumé de près de 10 articles ! Nov 14, 2023 pm 03:09 PM

Depuis que Neural Radiance Fields a été proposé en 2020, le nombre d'articles connexes a augmenté de façon exponentielle. Il est non seulement devenu une branche importante de la reconstruction tridimensionnelle, mais est également progressivement devenu actif à la frontière de la recherche en tant qu'outil important pour la conduite autonome. . NeRF a soudainement émergé au cours des deux dernières années, principalement parce qu'il ignore l'extraction et la mise en correspondance des points caractéristiques, la géométrie et la triangulation épipolaires, le PnP plus l'ajustement du faisceau et d'autres étapes du pipeline de reconstruction CV traditionnel, et ignore même la reconstruction du maillage, la cartographie et le traçage de la lumière. , directement à partir de la 2D L'image d'entrée est utilisée pour apprendre un champ de rayonnement, puis une image rendue qui se rapproche d'une photo réelle est sortie du champ de rayonnement. En d’autres termes, supposons qu’un modèle tridimensionnel implicite basé sur un réseau neuronal s’adapte à la perspective spécifiée.

Comment développer un chatbot intelligent en utilisant ChatGPT et Java Comment développer un chatbot intelligent en utilisant ChatGPT et Java Oct 28, 2023 am 08:54 AM

Dans cet article, nous présenterons comment développer des chatbots intelligents à l'aide de ChatGPT et Java, et fournirons quelques exemples de code spécifiques. ChatGPT est la dernière version du Generative Pre-training Transformer développé par OpenAI, une technologie d'intelligence artificielle basée sur un réseau neuronal qui peut comprendre le langage naturel et générer du texte de type humain. En utilisant ChatGPT, nous pouvons facilement créer des discussions adaptatives

Chatgpt peut-il être utilisé en Chine ? Chatgpt peut-il être utilisé en Chine ? Mar 05, 2024 pm 03:05 PM

chatgpt peut être utilisé en Chine, mais ne peut pas être enregistré, ni à Hong Kong et Macao. Si les utilisateurs souhaitent s'inscrire, ils peuvent utiliser un numéro de téléphone mobile étranger pour s'inscrire. Notez que lors du processus d'enregistrement, l'environnement réseau doit être basculé vers. une adresse IP étrangère.

Comment créer un robot de service client intelligent en utilisant ChatGPT PHP Comment créer un robot de service client intelligent en utilisant ChatGPT PHP Oct 28, 2023 am 09:34 AM

Comment utiliser ChatGPTPHP pour créer un robot de service client intelligent Introduction : Avec le développement de la technologie de l'intelligence artificielle, les robots sont de plus en plus utilisés dans le domaine du service client. L'utilisation de ChatGPTPHP pour créer un robot de service client intelligent peut aider les entreprises à fournir des services client plus efficaces et personnalisés. Cet article explique comment utiliser ChatGPTPHP pour créer un robot de service client intelligent et fournit des exemples de code spécifiques. 1. Installez ChatGPTPHP et utilisez ChatGPTPHP pour créer un robot de service client intelligent.

See all articles