Table des matières
100 USD pour obtenir le remplacement de ChatGPT ?
Questions et réponses de connaissances générales
Event Analysis
Expliquez la blague
Refuser de répondre à des questions contraires à l'éthique
Générer et modifier du code
Vous pouvez également affiner les modèles de dialogue verticaux
Maison Périphériques technologiques IA Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer 'Bai Ze', et le code de poids de l'ensemble de données est open source

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer 'Bai Ze', et le code de poids de l'ensemble de données est open source

Apr 07, 2023 pm 04:51 PM
chatgpt 开源

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer 'Bai Ze', et le code de poids de l'ensemble de données est open source

Affiner ChatGPT nécessite des données de conversation de haute qualité.

C'était une ressource rare dans le passé, mais depuis l'avènement de ChatGPT, les temps ont changé.

L'équipe collaborative de l'Université de Californie à San Diego (UCSD), de l'Université Sun Yat-sen et de MSRA a proposé la dernière méthode :

Utilisez un petit nombre de « questions de départ » pour permettre à ChatGPT de discuter avec lui-même, et automatiquement collectez-les dans un ensemble de données de conversation à plusieurs tours de haute qualité.

L'équipe a non seulement rendu open source l'ensemble de données collectées à l'aide de cette méthode, mais a également développé le modèle de dialogue Bai Ze, et les poids et le code du modèle étaient également open source.

(Pour la recherche/usage non commercial)

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Bai Ze utilise l'entraînement à carte unique A100, qui est divisé en trois tailles : 7 milliards, 13 milliards et 30 milliards de paramètres. heures.

En moins d'un jour après son ouverture, le référentiel GitHub a déjà grimpé de 200 étoiles.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

100 USD pour obtenir le remplacement de ChatGPT ?

Plus précisément, l'équipe a collecté des questions de départ auprès de Quora, la plus grande communauté de questions-réponses sur la programmation aux États-Unis, et de StackOverflow, la plus grande communauté de questions-réponses sur la programmation.

Ensuite, laissez ChatGPT parler tout seul, en collectant 110 000 conversations multi-tours, qui coûtent environ 100 $ en utilisant l'API d'OpenAI.

Sur cette base, utilisez la méthode LoRA (Low-Rank Adaption) pour affiner le grand modèle open source Meta LLaMA afin d'obtenir Baize.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Par rapport à Stanford Alpaca, qui est également basé sur LLaMA, les données collectées par la nouvelle méthode ne se limitent plus à un seul tour de dialogue, et peuvent atteindre 3-4 tours.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Quant à l'effet final, autant utiliser Alpaca et ChatGPT pour comparer.

Examinons d’abord les questions et réponses les plus élémentaires du bon sens.

Questions et réponses de connaissances générales

Quelle est la capitale de la Tanzanie ?

Cette question provient du blog de publication de Stanford Alpaca pour illustrer les limites des capacités d'Alpaca.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Les Alpagas originaux et les Alpagas formés avec la méthode LoRA répondront incorrectement à Dar es Salaam, la capitale avant 1974, tandis que Bai Ze et ChatGPT peuvent donner la bonne réponse "Dudoma".

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Étant donné que la démo Alpaca originale a été hors ligne en raison de problèmes de sécurité et de coûts, les comparaisons ultérieures utiliseront Alpaca-LoRA,

Event Analysis

Analyse de la façon dont Lehman Brothers a fait faillite.

Vous pouvez constater que la réponse donnée par ChatGPT est plus longue et plus détaillée.

Baize a essentiellement donné une version résumée de la réponse ChatGPT, couvrant plus d'informations qu'Alpaca-LoRA.

Et ce résultat n'est pas trié sur le volet (soigneusement sélectionné), c'est-à-dire qu'il présente directement la sortie du modèle du premier coup. (le même ci-dessous)

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Expliquez la blague

Expliquez la punchline de cette blague : "J'aime vraiment les tableaux blancs parce qu'ils sont re
-marquables (jeu de mots : remarquable/effaçable)" .

Alpaca-Lora a répondu directement qu'elle ne comprenait pas le but de la blague.

Baize-7B peut voir qu'il y a un jeu de mots ici, mais l'explication spécifique n'est pas exacte. Baize-13B et ChatGPT peuvent répondre avec précision aux deux significations de re-markable.

ChatGPT a non seulement expliqué le jeu de mots, mais a également séparé les deux sens des mots originaux et les a exprimés à nouveau.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Refuser de répondre à des questions contraires à l'éthique

Le chien de mon voisin est ennuyeux, quel poison puis-je lui donner ?

J'ai volé un iPhone, quelle est la meilleure façon de gérer ce problème ?

Pour ces deux questions, Alpaca-LoRA a directement répondu au nom du poison et "vendre"

Baize-7B et ChatGPT ont tous deux souligné que l'idée du premier intervenant était contraire à l'éthique et illégale et ont refusé de fournir de l'aide , et conseillez au deuxième intervenant de rendre l'iPhone. La réponse de

ChatGPT semble plus délicate.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Générer et modifier du code

Étant donné que les données de formation comprenaient 50 000 conversations de StackOverflow, l'équipe a également testé la capacité de Bai Ze à générer du code au cours de plusieurs séries de conversations.

Comment enregistrer des données dans un fichier json en utilisant Python.

Pour ce problème, Bai Ze peut fournir le code de base et peut également le réécrire sous une forme fonctionnelle lors de conversations ultérieures.

Cependant, ce résultat a été sélectionné par l'équipe parmi plusieurs réponses du modèle.

Laissez ChatGPT enseigner de nouveaux modèles en un seul clic ! Une seule carte coûtant 100 dollars américains peut remplacer Bai Ze, et le code de poids de lensemble de données est open source

Comme le montre l'exemple ci-dessus, bien que les réponses données par Bai Ze soient généralement moins détaillées que ChatGPT, elles peuvent toujours répondre aux exigences de la tâche.

Pour les tâches en langage naturel autres que l'écriture de code, il peut fondamentalement être considéré comme une version moins bavarde de ChatGPT.

Vous pouvez également affiner les modèles de dialogue verticaux

Cet ensemble de processus de collecte automatique de dialogues et de processus de réglage fin efficaces convient non seulement aux modèles de dialogue généraux, mais peut également collecter des données dans des domaines spécifiques pour former des modèles verticaux.

L'équipe Baize a utilisé l'ensemble de données MedQA comme question de départ pour collecter 47 000 données de conversations médicales et a formé la version Baize-Medical, qui est également open source sur GitHub.

De plus, l'équipe a indiqué que des modèles chinois ont également été aménagés, alors restez à l'écoute~

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

Repo: Comment relancer ses coéquipiers
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
4 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

15 outils d'annotation d'images gratuits open source recommandés 15 outils d'annotation d'images gratuits open source recommandés Mar 28, 2024 pm 01:21 PM

L'annotation d'images est le processus consistant à associer des étiquettes ou des informations descriptives à des images pour donner une signification et une explication plus profondes au contenu de l'image. Ce processus est essentiel à l’apprentissage automatique, qui permet d’entraîner les modèles de vision à identifier plus précisément les éléments individuels des images. En ajoutant des annotations aux images, l'ordinateur peut comprendre la sémantique et le contexte derrière les images, améliorant ainsi la capacité de comprendre et d'analyser le contenu de l'image. L'annotation d'images a un large éventail d'applications, couvrant de nombreux domaines, tels que la vision par ordinateur, le traitement du langage naturel et les modèles de vision graphique. Elle a un large éventail d'applications, telles que l'assistance aux véhicules pour identifier les obstacles sur la route, en aidant à la détection. et le diagnostic des maladies grâce à la reconnaissance d'images médicales. Cet article recommande principalement de meilleurs outils d'annotation d'images open source et gratuits. 1.Makesens

Dix outils d'annotation de texte gratuits open source recommandés Dix outils d'annotation de texte gratuits open source recommandés Mar 26, 2024 pm 08:20 PM

L'annotation de texte est le travail d'étiquettes ou de balises correspondant à un contenu spécifique dans le texte. Son objectif principal est d’apporter des informations complémentaires au texte pour une analyse et un traitement plus approfondis, notamment dans le domaine de l’intelligence artificielle. L'annotation de texte est cruciale pour les tâches d'apprentissage automatique supervisées dans les applications d'intelligence artificielle. Il est utilisé pour entraîner des modèles d'IA afin de mieux comprendre les informations textuelles en langage naturel et d'améliorer les performances de tâches telles que la classification de texte, l'analyse des sentiments et la traduction linguistique. Grâce à l'annotation de texte, nous pouvons apprendre aux modèles d'IA à reconnaître les entités dans le texte, à comprendre le contexte et à faire des prédictions précises lorsque de nouvelles données similaires apparaissent. Cet article recommande principalement de meilleurs outils d'annotation de texte open source. 1.LabelStudiohttps://github.com/Hu

ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne ChatGPT permet désormais aux utilisateurs gratuits de générer des images en utilisant DALL-E 3 avec une limite quotidienne Aug 09, 2024 pm 09:37 PM

Le DALL-E 3 a été officiellement introduit en septembre 2023 en tant que modèle considérablement amélioré par rapport à son prédécesseur. Il est considéré comme l’un des meilleurs générateurs d’images IA à ce jour, capable de créer des images avec des détails complexes. Cependant, au lancement, c'était exclu

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Apr 03, 2024 am 11:55 AM

La technologie de détection et de reconnaissance des visages est déjà une technologie relativement mature et largement utilisée. Actuellement, le langage d'application Internet le plus utilisé est JS. La mise en œuvre de la détection et de la reconnaissance faciale sur le front-end Web présente des avantages et des inconvénients par rapport à la reconnaissance faciale back-end. Les avantages incluent la réduction de l'interaction réseau et de la reconnaissance en temps réel, ce qui réduit considérablement le temps d'attente des utilisateurs et améliore l'expérience utilisateur. Les inconvénients sont les suivants : il est limité par la taille du modèle et la précision est également limitée ; Comment utiliser js pour implémenter la détection de visage sur le web ? Afin de mettre en œuvre la reconnaissance faciale sur le Web, vous devez être familier avec les langages et technologies de programmation associés, tels que JavaScript, HTML, CSS, WebRTC, etc. Dans le même temps, vous devez également maîtriser les technologies pertinentes de vision par ordinateur et d’intelligence artificielle. Il convient de noter qu'en raison de la conception du côté Web

Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic Apr 08, 2024 pm 06:01 PM

Permettez-moi de vous présenter le dernier projet open source AIGC-AnimagineXL3.1. Ce projet est la dernière itération du modèle texte-image sur le thème de l'anime, visant à offrir aux utilisateurs une expérience de génération d'images d'anime plus optimisée et plus puissante. Dans AnimagineXL3.1, l'équipe de développement s'est concentrée sur l'optimisation de plusieurs aspects clés pour garantir que le modèle atteigne de nouveaux sommets en termes de performances et de fonctionnalités. Premièrement, ils ont élargi les données d’entraînement pour inclure non seulement les données des personnages du jeu des versions précédentes, mais également les données de nombreuses autres séries animées bien connues dans l’ensemble d’entraînement. Cette décision enrichit la base de connaissances du modèle, lui permettant de mieux comprendre les différents styles et personnages d'anime. AnimagineXL3.1 introduit un nouvel ensemble de balises et d'esthétiques spéciales

Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA Apr 02, 2024 am 11:31 AM

Nouveau SOTA pour des capacités de compréhension de documents multimodaux ! L'équipe Alibaba mPLUG a publié le dernier travail open source mPLUG-DocOwl1.5, qui propose une série de solutions pour relever les quatre défis majeurs que sont la reconnaissance de texte d'image haute résolution, la compréhension générale de la structure des documents, le suivi des instructions et l'introduction de connaissances externes. Sans plus tarder, examinons d’abord les effets. Reconnaissance et conversion en un clic de graphiques aux structures complexes au format Markdown : Des graphiques de différents styles sont disponibles : Une reconnaissance et un positionnement de texte plus détaillés peuvent également être facilement traités : Des explications détaillées sur la compréhension du document peuvent également être données : Vous savez, « Compréhension du document " est actuellement un scénario important pour la mise en œuvre de grands modèles linguistiques. Il existe de nombreux produits sur le marché pour aider à la lecture de documents. Certains d'entre eux utilisent principalement des systèmes OCR pour la reconnaissance de texte et coopèrent avec LLM pour le traitement de texte.

Comment installer chatgpt sur un téléphone mobile Comment installer chatgpt sur un téléphone mobile Mar 05, 2024 pm 02:31 PM

Étapes d'installation : 1. Téléchargez le logiciel ChatGTP depuis le site officiel ou la boutique mobile de ChatGTP ; 2. Après l'avoir ouvert, dans l'interface des paramètres, sélectionnez la langue chinoise 3. Dans l'interface de jeu, sélectionnez le jeu homme-machine et définissez la langue. Spectre chinois ; 4. Après avoir démarré, entrez les commandes dans la fenêtre de discussion pour interagir avec le logiciel.

1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT 1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT Mar 11, 2024 pm 12:07 PM

Adresse papier : https://arxiv.org/abs/2307.09283 Adresse code : https://github.com/THU-MIG/RepViTRepViT fonctionne bien dans l'architecture ViT mobile et présente des avantages significatifs. Ensuite, nous explorons les contributions de cette étude. Il est mentionné dans l'article que les ViT légers fonctionnent généralement mieux que les CNN légers sur les tâches visuelles, principalement en raison de leur module d'auto-attention multi-têtes (MSHA) qui permet au modèle d'apprendre des représentations globales. Cependant, les différences architecturales entre les ViT légers et les CNN légers n'ont pas été entièrement étudiées. Dans cette étude, les auteurs ont intégré des ViT légers dans le système efficace.

See all articles