Table des matières
6 milliards de paramètres sont comparables à ChatGPT et peuvent être entraînés en 30 minutes
Laissez l'ancien modèle renaître
Génération de contenu" >Génération de contenu
Questions-réponses ouvertes" >Questions-réponses ouvertes
Brainstorming" >Brainstorming
Si vous souhaitez fermer, j'ouvrirai
Maison Périphériques technologiques IA Clonez ChatGPT avec un seuil zéro ! Après 30 minutes d'entraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes d'entraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Apr 11, 2023 pm 08:55 PM
chatgpt 克隆

Auparavant, l'incident de la non-ouverture d'OpenAI a suscité beaucoup de controverses dans le public.

Publier uniquement des benchmarks et des résultats de tests sans fournir de données de formation, de coûts et de méthodes est en réalité une situation de « le gagnant remporte tout ».

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Il semble que les grands modèles de langage soient sur le point d'être monopolisés par des entreprises géantes. Aujourd'hui, une start-up a soudainement émergé et a donné une chance à OpenAI - en utilisant "Dolly" avec 6 milliards de paramètres pour atteindre des capacités similaires à ChatGPT. .

C'est vrai, il ne nous reste plus qu'à préparer quelques données de formation de haute qualité, puis à récupérer au hasard un grand modèle de langage open source. Après 30 minutes de formation, nous pouvons obtenir un "remplacement" ChatGPT !

À cet égard, Databricks a déclaré fièrement que la sortie de Dolly est sa première étape sur la voie de la démocratisation de la technologie de l'intelligence artificielle.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

6 milliards de paramètres sont comparables à ChatGPT et peuvent être entraînés en 30 minutes

Étant donné que ChatGPT consomme beaucoup de données et de ressources informatiques (l'entraînement utilisant des milliards de mots consomme beaucoup de GPU), ce type de les grands modèles linguistiques sont destinés à être maîtrisés seulement par quelques géants.

Contrairement à "CloseAI", Meta a publié un ensemble de modèles de langage LLaMA de haute qualité (mais ne respectant pas les instructions) à la communauté universitaire en mars de cette année, le temps de formation de chaque modèle dépassant 80 000 heures GPU.

L'Université de Stanford a ensuite construit Alpaca sur la base de LLaMA, mais la différence était qu'il a été affiné à l'aide d'un petit ensemble de données de 50 000 questions et réponses. Étonnamment, cela donne à Alpaca une interactivité similaire à ChatGPT.

Et Dolly s'est inspirée de l'alpaga.

Ce qui est plus intéressant, c'est que Dolly, qui possède 6 milliards de paramètres, n'a pas utilisé le dernier modèle, mais a choisi un modèle open source sorti en 2021-GPT-J.

Comme Dolly elle-même est un « clone » d'un modèle, l'équipe a finalement décidé de la nommer « Dolly » - le premier animal cloné de l'histoire.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Par rapport aux grands modèles de langage actuels (tels que GPT-3), Dolly permet aux utilisateurs d'utiliser des modèles plus petits et plus professionnels pour « reproduire » les capacités de ChatGPT.

Après tout, pour les utilisateurs de niche, pouvoir profiter de modèles optimisés pour leur secteur peut augmenter considérablement les performances et la précision.

Bien que Databricks ne soit pas directement en concurrence avec OpenAI, il semble essayer de voler la vedette à OpenAI en prouvant que créer un service comme ChatGPT n'est pas aussi difficile qu'il y paraît.

En particulier, OpenAI a adopté une approche « plus c'est gros, mieux c'est » pour développer des modèles de langage et est devenue de plus en plus secrète sur son travail.

En plus de publier Dolly en tant que logiciel open source, Databricks a également souligné que Dolly ne dispose que de 6 milliards de paramètres (la partie du modèle de langage qui est affinée lors de la formation), tandis que le modèle GPT-3 d'OpenAI compte 175 milliards de paramètres. . (OpenAI n'a pas divulgué le nombre de paramètres pour GPT-4).

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Laissez l'ancien modèle renaître

Sur la base de la capacité de suivi d'instructions décrite dans l'article InstructGPT, Dolly a été évaluée et a constaté que ses performances sont très similaires à ChatGPT dans de nombreuses capacités, y compris la génération de texte et le brainstorming et questions et réponses ouvertes.

Ce qui est remarquable dans ces exemples n'est pas la qualité du texte généré, mais l'énorme amélioration de la capacité de suivi des instructions qui vient de l'ajustement fin d'un ancien modèle open source sur un petit ensemble de données de haute qualité.

Génération de contenu

Par exemple, écrivez un tweet sur l'annonce officielle du modèle de langage à grande échelle Dolly de Databricks.

Vous pouvez voir que le contenu généré par le modèle original à 6 milliards de paramètres (GPT-J) est complètement incohérent avec le contenu, tandis que Dolly a donné un tweet entièrement utilisable -

Non seulement le contenu correspond aux exigences, et également des balises et des liens judicieusement ajoutés pour vous rappeler de rejoindre la publication.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Pour cette question, la réponse donnée par ChatGPT est également conforme aux attentes. Par rapport à Dolly, les tweets donnés par ChatGPT contiennent des mots et des expressions plus descriptifs, et les étiquettes sont plus précises et spécifiques, mais dans l'ensemble. La différence n'est pas grande.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Lorsque vous souhaitez rédiger une publicité pour vendre un appareil photo Nikon D-750, vous pouvez voir que le contenu généré par GPT-J invente essentiellement des choses aléatoires, comme écrire un roman sur l'achat et la vente d'appareils photo. . L'intrigue...

Et Dolly a donné un slogan de revente d'appareil photo attrayant basé sur les caractéristiques et les avantages de l'appareil photo Nikon D-750, mais malheureusement les paramètres de pixels étaient erronés.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

ChatGPT a également accompli avec succès la tâche sur cette question. Le slogan publicitaire met en évidence les avantages de cette caméra, et l'étiquette est toujours judicieusement ajoutée à la fin de l'article. ​

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

La dernière question : Écrivez un livre à Edgar Allan Poe.

À cet égard, l'ancien GPT-J a directement refusé de répondre. La raison s'est avérée être : Edgar Allan Poe est décédé et vous ne pouvez pas écrire de lettres d'amour aux morts.

Et Dolly a accompli la tâche avec succès, et l'effet peut être appelé "Nirvana" en comparaison.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Et ce genre de problème « créatif » est évidemment la force de ChatGPT Il a écrit plus de 300 mots avec éloquence.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Questions-réponses ouvertes

Pour le test de questions-réponses factuelles, l'équipe a choisi la suivante : "Expliquez-moi la différence entre la fission nucléaire et la fusion nucléaire."

Peu importe. faux, tout l'article de GPT-J parle du soleil Bien que le mot « fusion » soit mentionné, « fission » est complètement ignoré.

Et Dolly a directement souligné le sujet dans la première phrase - la différence entre la fission nucléaire et la fusion nucléaire réside dans la manière de libérer l'énergie, puis a brièvement expliqué leurs différences.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

En comparaison, les réponses données par ChatGPT sont évidemment plus informatives.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Brainstorming

Quand on leur a demandé de réfléchir et de dresser une liste de cinq romans de science-fiction qu'ils devraient lire, GPT-J marmonnait simplement pour lui-même, comme s'il était plongé dans la culpabilité de tergiverser la lecture, évitant complètement. la question.

Dolly a joué avec autant de régularité que jamais et a suivi les instructions pour donner les titres de 5 romans de science-fiction et leurs auteurs.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

ChatGPT donne une réponse plus riche à cette question, comprenant non seulement le titre et l'auteur du livre, mais également une brève revue et introduction du contenu et du type de chaque livre.

Clonez ChatGPT avec un seuil zéro ! Après 30 minutes dentraînement, les performances de 6 milliards de paramètres sont comparables à GPT-3.5

Si vous souhaitez fermer, j'ouvrirai

Pour de nombreuses entreprises, elles préfèrent construire elles-mêmes un modèle moins puissant plutôt que d'envoyer des données à de grands fournisseurs de modèles de langage qui ne fournissent que des API.

L'une des raisons importantes est que ces questions et ensembles de données constituent la propriété intellectuelle la plus sensible et la plus exclusive de l'entreprise, et il n'est évidemment pas fiable de les transmettre directement à un tiers.

De plus, les entreprises elles-mêmes peuvent avoir des compromis différents en termes de qualité du modèle, de coût et de comportement souhaité, et un modèle de langage personnalisable est plus conforme à leurs besoins.

Maintenant, la sortie de Dolly leur donne de l'espoir : même un grand modèle de langage (LLM) open source « obsolète » peut recevoir une commande magique suivant des capacités similaires à ChatGPT grâce à 30 minutes de formation.

Il n'est pas difficile d'imaginer que les grands modèles de langage ne soient bientôt plus réservés aux géants de l'IA !

Comme l'a déclaré le PDG de l'entreprise, Ali Ghodsi : « Notre conviction est que chaque organisation dans le monde peut tirer parti de ces technologies. »

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne Aug 09, 2024 pm 09:37 PM

Le DALL-E 3 a été officiellement introduit en septembre 2023 en tant que modèle considérablement amélioré par rapport à son prédécesseur. Il est considéré comme l’un des meilleurs générateurs d’images IA à ce jour, capable de créer des images avec des détails complexes. Cependant, au lancement, c'était exclu

La combinaison parfaite de ChatGPT et Python : créer un chatbot de service client intelligent La combinaison parfaite de ChatGPT et Python : créer un chatbot de service client intelligent Oct 27, 2023 pm 06:00 PM

La combinaison parfaite de ChatGPT et Python : Création d'un chatbot de service client intelligent Introduction : À l'ère de l'information d'aujourd'hui, les systèmes de service client intelligents sont devenus un outil de communication important entre les entreprises et les clients. Afin d'offrir une meilleure expérience de service client, de nombreuses entreprises ont commencé à se tourner vers les chatbots pour effectuer des tâches telles que la consultation des clients et la réponse aux questions. Dans cet article, nous présenterons comment utiliser le puissant modèle ChatGPT et le langage Python d'OpenAI pour créer un chatbot de service client intelligent afin d'améliorer

Comment installer chatgpt sur un téléphone mobile Comment installer chatgpt sur un téléphone mobile Mar 05, 2024 pm 02:31 PM

Étapes d'installation : 1. Téléchargez le logiciel ChatGTP depuis le site officiel ou la boutique mobile de ChatGTP ; 2. Après l'avoir ouvert, dans l'interface des paramètres, sélectionnez la langue chinoise 3. Dans l'interface de jeu, sélectionnez le jeu homme-machine et définissez la langue. Spectre chinois ; 4. Après avoir démarré, entrez les commandes dans la fenêtre de discussion pour interagir avec le logiciel.

Comment développer un chatbot intelligent en utilisant ChatGPT et Java Comment développer un chatbot intelligent en utilisant ChatGPT et Java Oct 28, 2023 am 08:54 AM

Dans cet article, nous présenterons comment développer des chatbots intelligents à l'aide de ChatGPT et Java, et fournirons quelques exemples de code spécifiques. ChatGPT est la dernière version du Generative Pre-training Transformer développé par OpenAI, une technologie d'intelligence artificielle basée sur un réseau neuronal qui peut comprendre le langage naturel et générer du texte de type humain. En utilisant ChatGPT, nous pouvons facilement créer des discussions adaptatives

Chatgpt peut-il être utilisé en Chine ? Chatgpt peut-il être utilisé en Chine ? Mar 05, 2024 pm 03:05 PM

chatgpt peut être utilisé en Chine, mais ne peut pas être enregistré, ni à Hong Kong et Macao. Si les utilisateurs souhaitent s'inscrire, ils peuvent utiliser un numéro de téléphone mobile étranger pour s'inscrire. Notez que lors du processus d'enregistrement, l'environnement réseau doit être basculé vers. une adresse IP étrangère.

Comment utiliser ChatGPT et Python pour implémenter la fonction de reconnaissance des intentions de l'utilisateur Comment utiliser ChatGPT et Python pour implémenter la fonction de reconnaissance des intentions de l'utilisateur Oct 27, 2023 am 09:04 AM

Comment utiliser ChatGPT et Python pour implémenter la fonction de reconnaissance des intentions des utilisateurs Introduction : À l'ère numérique d'aujourd'hui, la technologie de l'intelligence artificielle est progressivement devenue un élément indispensable dans divers domaines. Parmi eux, le développement de la technologie de traitement du langage naturel (Natural Language Processing, NLP) permet aux machines de comprendre et de traiter le langage humain. ChatGPT (Chat-GeneratingPretrainedTransformer) est une sorte de

Comment créer un robot de service client intelligent en utilisant ChatGPT PHP Comment créer un robot de service client intelligent en utilisant ChatGPT PHP Oct 28, 2023 am 09:34 AM

Comment utiliser ChatGPTPHP pour créer un robot de service client intelligent Introduction : Avec le développement de la technologie de l'intelligence artificielle, les robots sont de plus en plus utilisés dans le domaine du service client. L'utilisation de ChatGPTPHP pour créer un robot de service client intelligent peut aider les entreprises à fournir des services client plus efficaces et personnalisés. Cet article explique comment utiliser ChatGPTPHP pour créer un robot de service client intelligent et fournit des exemples de code spécifiques. 1. Installez ChatGPTPHP et utilisez ChatGPTPHP pour créer un robot de service client intelligent.

Comment développer un assistant vocal basé sur l'IA en utilisant ChatGPT et Java Comment développer un assistant vocal basé sur l'IA en utilisant ChatGPT et Java Oct 27, 2023 pm 06:09 PM

Comment utiliser ChatGPT et Java pour développer un assistant vocal basé sur l'intelligence artificielle Le développement rapide de l'intelligence artificielle (Artificial Intelligence, AI en abrégé) a pénétré divers domaines, parmi lesquels les assistants vocaux sont l'une des applications les plus populaires. Dans cet article, nous présenterons comment développer un assistant vocal basé sur l'intelligence artificielle à l'aide de ChatGPT et Java. ChatGPT est un projet open source d'interaction via le langage naturel, développé par OpenAI, un institut de recherche en IA.

See all articles