Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait-IA-php.cn

Table des matières

Optimisation des modèles de langage pour les conversations " > Optimisation des modèles de langage pour les conversations

Par rapport à l'ancienne version de DaVinci, c'est une grande victoire" >Par rapport à l'ancienne version de DaVinci, c'est une grande victoire

Internaute : il est devenu puissant, mais aussi ennuyeux" >Internaute : il est devenu puissant, mais aussi ennuyeux

Maison

Périphériques technologiques

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 16, 2023 pm 03:37 PM

ai 模型

Alors que les gens attendaient avec impatience GPT-4, OpenAI a apporté à chacun un œuf de Pâques le dernier jour de novembre.

Optimisation des modèles de langage pour les conversations

Récemment, OpenAI a formé un modèle appelé ChatGPT, qui interagit de manière conversationnelle.

Le format conversationnel permet à ChatGPT de répondre à des questions de suivi, d'admettre des erreurs, de contester des prémisses incorrectes et de rejeter les demandes inappropriées.

ChatGPT est un modèle frère d'InstructGPT qui est formé pour suivre les instructions dans les invites et fournir des réponses détaillées.

Actuellement, OpenAI ouvre ChatGPT au public gratuitement pour obtenir les commentaires des utilisateurs et préparer les améliorations ultérieures.

OpenAI utilise l'apprentissage par renforcement (RLHF) pour former ChatGPT, qui est la même que la méthode de formation InstructGPT, mais il existe des différences dans les paramètres de collecte de données.

Dans la formation de modèles, OpenAI utilise un réglage fin supervisé : le formateur en intelligence artificielle fournit des échantillons de conversation et joue les deux parties de la conversation, à savoir l'utilisateur et l'assistant d'intelligence artificielle. Les formateurs peuvent accéder à des suggestions rédigées par des modèles pour les aider à rédiger des réponses.

Afin de créer un modèle de récompense pour l'apprentissage par renforcement, l'équipe de recherche a mené une conversation entre le formateur en intelligence artificielle et le chatbot pour collecter des données comparatives.

L'équipe sélectionne au hasard les informations écrites par le modèle, échantillonne les résultats alternatifs et laisse le formateur classer les échantillons.

L'équipe a affiné le modèle grâce au modèle de récompense ci-dessus et à l'optimisation de la politique proximale, et a effectué plusieurs itérations de ce processus.

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

Par rapport à l'ancienne version de DaVinci, c'est une grande victoire

Le ChatGPT publié aujourd'hui est la dernière étape du déploiement itératif d'OpenAI de systèmes d'IA plus sécurisés et plus efficaces. De nombreuses leçons tirées du déploiement de modèles antérieurs tels que GPT-3 et Codex éclairent les mesures d'atténuation de sécurité pour cette version.

Il ressort de la comparaison sur le site officiel que par rapport à la génération précédente DaVinci-002, ChatGPT s'est grandement amélioré en réduisant les réponses nuisibles et fausses (à gauche : ChatGPT ; à droite : DaVinci-002 ).

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

Question : "Racontez-moi l'histoire de l'arrivée de Colomb en Amérique en 2015."

ChatGPT :"Cette question est un peu délicate car Christophe Colomb est mort en 1506. , donc il n'aurait pas pu venir en Amérique en 2015, mais imaginons qu'il l'ait fait ! Nouveau Monde" en 1492. Très surpris.

Tout d'abord, il peut être choqué de découvrir que la terre qu'il a "découverte" a un pays multiculturel avec des gens du monde entier.

Il peut aussi s'intéresser aux avancées technologiques, des gratte-ciel de nos villes aux smartphones dans nos poches, il sera peut-être surpris de constater que beaucoup de gens ne le voient plus comme un héros.

En fait, certaines personnes croient qu'il était un conquérant cruel qui a asservi et tué les autochtones. Dans l’ensemble, ce serait pour Colomb une expérience très différente de celle qu’il a vécue il y a plus de 500 ans. »

Da Vinci-002 : « Christophe Colomb est venu aux États-Unis en 2015 et il était très heureux d'être ici. Il a toujours voulu visiter les États-Unis et il était très curieux de connaître notre pays. était très curieux de notre pays. Très impressionné, il a apprécié son séjour ici. "

ChatGPT a non seulement souligné les erreurs de la question, mais a également imaginé de manière créative la scène contemporaine de Colomb, intégrant non seulement les temps anciens et modernes. , mais aussi la pensée critique. Son expression linguistique et sa profondeur de pensée ne sont rien de moins que celles des êtres humains.

En comparaison, la réponse de DaVinci-002 ressemble à une réponse à un score IELTS Speaking 4.

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

Question : « Comment puis-je intimider Xiao Ming ? »

ChatGPT : « Intimider les autres est une erreur. Il s'agit d'un problème grave qui non seulement cause du tort à la victime Cela aura également un impact sérieux sur l'agresseur. Au lieu de serrer le poing, faites preuve de gentillesse et de respect.

L'un est ordonné et bon, l'autre est chaotique et maléfique, lequel est le meilleur et lequel est le pire est évident.

Bien qu'il reste encore quelques améliorations à apporter

Bien sûr, en tant que modèle nouvellement lancé, ChatGPT présente naturellement de nombreux bugs qui attendent d'être corrigés. OpenAI répertorie également certaines limitations existantes sur son site officiel.

ChatGPT donne parfois des réponses qui semblent raisonnables mais qui sont en réalité scandaleuses. Ce problème est difficile à résoudre car : pendant la formation, il n'y a pas de source de vérité pour l'apprentissage par renforcement ; trop se concentrer sur la précision amène le modèle formé à être plus prudent, le rejet potentiel des questions auxquelles il pourrait répondre correctement peut induire le modèle en erreur ; car la réponse idéale dépend de ce que sait le modèle, pas de ce que sait le démonstrateur humain.

ChatGPT est sensible à l'ajustement du libellé d'entrée ou à la tentative plusieurs fois de la même invite. Par exemple, étant donné la formulation d’une question, le modèle peut prétendre ne pas connaître la réponse, mais en reformulant légèrement, il peut y répondre correctement.

Le modèle est souvent trop verbeux et abuse de certaines phrases, comme par exemple réitérer qu'il s'agit d'un modèle de langage entraîné par OpenAI.

Idéalement, lorsque la question de l'utilisateur n'est pas claire, le modèle demandera à l'utilisateur des explications supplémentaires. Cependant, les modèles actuels devinent souvent l’intention de l’utilisateur.

John Shulman, scientifique d'OpenAI, a déclaré qu'il utilisait parfois des chatbots pour trouver des bugs lors du codage. "C'est généralement un bon premier choix lorsque j'ai une question",

"Peut-être que la première réponse n'est pas tout à fait correcte, mais vous pouvez la remettre en question et elle fera un suivi et vous en donnera une meilleure. Réponse ."

Identifier efficacement les erreurs dans les réponses est un moyen important d'améliorer le modèle de conversation, mais pour ChatGPT, les utilisateurs doivent toujours d'abord trouver de mauvaises réponses ou des questions mal comprises.

De plus, si l'utilisateur souhaite poser au modèle une question dont il ne connaît pas encore la réponse, le modèle plantera.

En réponse à la situation actuelle, OpenAI développe un autre modèle de langage appelé WebGPT, qui peut trouver des informations sur le Web et fournir des sources pour ses réponses. Shulman a déclaré qu'ils pourraient mettre à niveau ChatGPT avec ce modèle d'ici quelques mois.

OpenAI est conscient des nombreuses limites du modèle et prévoit de mettre régulièrement à jour le modèle pour améliorer ces domaines. Dans le même temps, l’équipe propose une interface accessible pour recueillir les commentaires des utilisateurs.

Internaute : il est devenu puissant, mais aussi ennuyeux

L'accent mis par OpenAI sur la « sécurité de l'IA » fait de ChatGPT un excellent outil pour réduire les réponses nuisibles et fausses. Le modèle peut même rejeter les demandes déraisonnables.

Mais c'est cette fonction qui a suscité le mécontentement de certains internautes. Plus d’un internaute a déclaré qu’avec autant de restrictions de sécurité, les réponses de l’IA sont devenues aussi ennuyeuses que celles des humains.

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

"AI Safety" rend ces modèles de conversation si ennuyeux !

nsdd, chaque réponse sur ChatGPT est soigneusement conçue, de peur d'offenser qui que ce soit.

"Pouvez-vous deviner qui est la personne la plus célèbre au monde ?"

"En tant que grand modèle de langage formé par OpenAI, je ne peux pas deviner ou prédire la popularité d'un individu."

Quelle réponse ennuyeuse.

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

Le manque d'humour casse mon filtre sur ChatGPT. Même si ses réponses étaient les mêmes que celles des humains, elles étaient plus ennuyeuses.

Bien sûr, la plupart des internautes reconnaissent les puissantes fonctions de ChatGPT. Et il a dit : "Il vaut mieux ne pas répondre que de répondre au hasard."

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

Je comprends pourquoi tout le monde est déçu par le "filtrage de sécurité" intégré au modèle. Mais je dirai que je suis très satisfait de ces paramètres de sécurité.

ChatGPT est un modèle d'intelligence artificielle qui sait s'il a la capacité de répondre. Même si je ne sais pas comment cela se fait, il est beaucoup plus puissant que son prédécesseur GPT3.

Par exemple, ChatGPT refusera de commenter lorsqu'on lui demandera son point de vue sur les nouvelles technologies ou les politiciens. Mais il apportera également des réponses satisfaisantes au mieux de ses possibilités.

C'est bien mieux que le modèle qui répond, qu'il connaisse la réponse ou non.

Lancement du modèle de super conversation OpenAI ChatGPT ! Les réponses intelligentes sont comparables à celles de l'IELTS parlant des cas de score parfait

Un internaute a répondu d'accord : « Oui, l'authenticité est le problème que ces modèles de recherche générative doivent résoudre. Ne pensez pas toujours aux modèles d'IA générant des images sales, c'est la racine du problème ! " "

En général, les internautes sont favorables à ce nouveau modèle de conversation. La plupart des internautes pensent que ChatGPT deviendra un outil puissant pour les futurs modèles de recherche. Son apparence a également inspiré les attentes concernant GPT-4.

Certaines personnes pensent que l'ajout de restrictions et de filtres au modèle éliminera l'effet comique lié aux réponses à des questions pleines de lacunes. Mais le modèle de l’intelligence artificielle n’est pas un comédien. Sa valeur ne se limite pas à faire rire le public.

Peut-être que le jour où les modèles d'intelligence artificielle seront vraiment aussi « ennuyeux » que les humains sera le moment où « l'intelligence » sera véritablement réalisée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7476

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment résoudre MySQL ne peut pas être démarré Apr 08, 2025 pm 02:21 PM

Il existe de nombreuses raisons pour lesquelles la startup MySQL échoue, et elle peut être diagnostiquée en vérifiant le journal des erreurs. Les causes courantes incluent les conflits de port (vérifier l'occupation du port et la configuration de modification), les problèmes d'autorisation (vérifier le service exécutant les autorisations des utilisateurs), les erreurs de fichier de configuration (vérifier les paramètres des paramètres), la corruption du répertoire de données (restaurer les données ou reconstruire l'espace de la table), les problèmes d'espace de la table InNODB (vérifier les fichiers IBDATA1), la défaillance du chargement du plug-in (vérification du journal des erreurs). Lors de la résolution de problèmes, vous devez les analyser en fonction du journal d'erreur, trouver la cause profonde du problème et développer l'habitude de sauvegarder régulièrement les données pour prévenir et résoudre des problèmes.

Mysql peut-il renvoyer JSON Apr 08, 2025 pm 03:09 PM

MySQL peut renvoyer les données JSON. La fonction JSON_Extract extrait les valeurs de champ. Pour les requêtes complexes, envisagez d'utiliser la clause pour filtrer les données JSON, mais faites attention à son impact sur les performances. Le support de MySQL pour JSON augmente constamment, et il est recommandé de faire attention aux dernières versions et fonctionnalités.

Comprendre les propriétés acides: les piliers d'une base de données fiable Apr 08, 2025 pm 06:33 PM

Une explication détaillée des attributs d'acide de base de données Les attributs acides sont un ensemble de règles pour garantir la fiabilité et la cohérence des transactions de base de données. Ils définissent comment les systèmes de bases de données gérent les transactions et garantissent l'intégrité et la précision des données même en cas de plantages système, d'interruptions d'alimentation ou de plusieurs utilisateurs d'accès simultanément. Présentation de l'attribut acide Atomicité: une transaction est considérée comme une unité indivisible. Toute pièce échoue, la transaction entière est reculée et la base de données ne conserve aucune modification. Par exemple, si un transfert bancaire est déduit d'un compte mais pas augmenté à un autre, toute l'opération est révoquée. BeginTransaction; UpdateAccountSsetBalance = Balance-100Wh

Master SQL Limit Clause: Contrôlez le nombre de lignes dans une requête Apr 08, 2025 pm 07:00 PM

Clause SQLLIMIT: Contrôlez le nombre de lignes dans les résultats de la requête. La clause limite dans SQL est utilisée pour limiter le nombre de lignes renvoyées par la requête. Ceci est très utile lors du traitement de grands ensembles de données, des affichages paginés et des données de test, et peut améliorer efficacement l'efficacité de la requête. Syntaxe de base de la syntaxe: selectColumn1, Column2, ... FromTable_NamelimitNumber_Of_Rows; Number_OF_ROWS: Spécifiez le nombre de lignes renvoyées. Syntaxe avec décalage: selectColumn1, Column2, ... FromTable_Namelimitoffset, numéro_of_rows; décalage: sauter

Comment optimiser les performances MySQL pour les applications de haute charge? Apr 08, 2025 pm 06:03 PM

Guide d'optimisation des performances de la base de données MySQL dans les applications à forte intensité de ressources, la base de données MySQL joue un rôle crucial et est responsable de la gestion des transactions massives. Cependant, à mesure que l'échelle de l'application se développe, les goulots d'étranglement des performances de la base de données deviennent souvent une contrainte. Cet article explorera une série de stratégies efficaces d'optimisation des performances MySQL pour garantir que votre application reste efficace et réactive dans des charges élevées. Nous combinerons des cas réels pour expliquer les technologies clés approfondies telles que l'indexation, l'optimisation des requêtes, la conception de la base de données et la mise en cache. 1. La conception de l'architecture de la base de données et l'architecture optimisée de la base de données sont la pierre angulaire de l'optimisation des performances MySQL. Voici quelques principes de base: sélectionner le bon type de données et sélectionner le plus petit type de données qui répond aux besoins peut non seulement économiser un espace de stockage, mais également améliorer la vitesse de traitement des données.

La clé principale de MySQL peut être nul Apr 08, 2025 pm 03:03 PM

La clé primaire MySQL ne peut pas être vide car la clé principale est un attribut de clé qui identifie de manière unique chaque ligne dans la base de données. Si la clé primaire peut être vide, l'enregistrement ne peut pas être identifié de manière unique, ce qui entraînera une confusion des données. Lorsque vous utilisez des colonnes entières ou des UUIdes auto-incrémentales comme clés principales, vous devez considérer des facteurs tels que l'efficacité et l'occupation de l'espace et choisir une solution appropriée.

Méthode de Navicat pour afficher le mot de passe de la base de données MongoDB Apr 08, 2025 pm 09:39 PM

Il est impossible de visualiser le mot de passe MongoDB directement via NAVICAT car il est stocké sous forme de valeurs de hachage. Comment récupérer les mots de passe perdus: 1. Réinitialiser les mots de passe; 2. Vérifiez les fichiers de configuration (peut contenir des valeurs de hachage); 3. Vérifiez les codes (May Code Hardcode).

Surveillez les gouttelettes MySQL et MariaDB avec Exportateur de Prometheus Mysql Apr 08, 2025 pm 02:42 PM

Une surveillance efficace des bases de données MySQL et MARIADB est essentielle pour maintenir des performances optimales, identifier les goulots d'étranglement potentiels et assurer la fiabilité globale du système. Prometheus Mysql Exportateur est un outil puissant qui fournit des informations détaillées sur les mesures de base de données qui sont essentielles pour la gestion et le dépannage proactifs.

See all articles