Depuis son lancement à la fin de l'année dernière, le modèle d'IA conversationnelle ChatGPT est devenu populaire au sein de la communauté.
ChatGPT est en effet un outil étonnant, comme une « Boîte de Pandore ». Une fois que vous aurez trouvé la bonne façon de l’ouvrir, vous constaterez peut-être que vous ne pourrez plus vous en passer.
En tant que polyvalent, les gens ont diverses demandes concernant ChatGPT. Certaines personnes l'utilisent pour rédiger des articles, et d'autres l'utilisent pour discuter. Ce sont des façons courantes de jouer. Ouvrez un peu plus votre esprit Puisque ChatGPT est le « roi » de l’IA, va-t-il écrire une IA ?
Récemment, un blogueur dans le domaine de l'apprentissage automatique a eu une idée soudaine. Il a décidé de laisser ChatGPT construire un réseau neuronal et utiliser Keras pour résoudre le problème MNIST.
MNIST est considéré comme un problème classique dans le domaine de l'apprentissage automatique. Même si cet ensemble de données manuscrites a progressivement disparu du champ de la vision par ordinateur, sa signification commémorative ne peut être ignorée. Le premier ensemble de données permettant à de nombreuses personnes de se lancer dans l'apprentissage en profondeur et la première expérience visant à vérifier les algorithmes sont le MNIST.
Pas besoin d'en dire grand chose, il suffit d'y penser et de commencer à travailler. L'auteur a simplement demandé à ChatGPT d'écrire un morceau de code qui semblait parfait sans même avoir quoi que ce soit à changer.
C'est un bon début.
ChatGPT a choisi l'entropie croisée catégorique comme fonction de perte. L'auteur a proposé de réécrire le code d'entropie croisée catégorielle, et ChatGPT l'a remplacé par une entropie croisée catégorielle clairsemée. Le code mis à jour peut toujours fonctionner. On constate que la nouvelle fonction de perte abandonne la conversion de classification des étiquettes.
ChatGPT Le code généré utilise des couches entièrement connectées, mais l'auteur souhaite utiliser des couches convolutives. Par conséquent, ChatGPT a modifié le code comme indiqué et a ajouté une couche Conv2D et MaxPooling.
Vient ensuite l'étape d'évaluation du modèle final, où l'auteur a demandé à ChatGPT d'écrire le code à l'aide de l'ensemble de test.
Les résultats sont superbes et chaque réponse ChatGPT est accompagnée d'une explication complète. Par exemple, dans cette évaluation, cela est expliqué comme ceci :
La méthode "evaluate" prend les données de test et les étiquettes de test comme paramètres et renvoie la perte et la métrique spécifiées lors de la compilation du modèle (ici, la précision). L'extrait de code ci-dessus indique la précision du test, ce qui devrait vous donner une idée de la manière dont le modèle se généralise aux nouvelles données.
Le modèle a utilisé l'intégralité de l'ensemble de tests comme données de validation pendant la formation. Les auteurs ont ensuite demandé à ChatGPT de modifier ce chiffre à 20 % des données d'entraînement.
De plus, l'auteur souhaitait également avoir des tailles de lots plus petites et exécuter le code en moins d'époques. Bien que ChatGPT ne soit pas nécessaire pour cette étape, il ne souhaite pas modifier le code sans mettre à jour le contexte ChatGPT.
Cette tâche incombe donc toujours à ChatGPT :
Ensuite, l'auteur a l'intention de tracer la perte d'entraînement et de test au cours du processus d'entraînement. La suggestion de ChatGPT est que la ligne correspondant au modèle doit être modifiée pour capturer la valeur résultante.
Pour montrer quelques exemples de l'ensemble de données, l'auteur a demandé à ChatGPT d'écrire du code pour générer une combinaison d'images et de balises. Le code de ces sorties est également parfait et est livré avec une collection de 20 images.
Lors de la construction d'une maquette, il faut également regarder sa structure. Si vous posez cette question à ChatGPT, la réponse est :
ChatGPT donne un résumé du modèle :
Le résumé du modèle est utile, mais l'auteur aimerait voir le modèle structure affichée. Alors continuez à demander :
Le résultat est satisfaisant Enfin, nous sommes prêts à déployer ce modèle. Laissez ChatGPT enregistrer le modèle sur le disque :
Maintenant, l'auteur veut. pour créer une utilisation La classe pour laquelle le modèle enregistré a fait des prédictions. Cette invite est intéressante et la solution est parfaite.
Écrivez maintenant un exemple pour prédire les étiquettes de 10 images aléatoires en utilisant la classe de prédicteur :
Pour ce faire, l'auteur a demandé à ChatGPT d'afficher une matrice de confusion :
Inutile de dire que le style utilisé par ChatGPT est vraiment joli.
Après avoir terminé toutes les expériences, l'auteur a publié tous les codes générés par ChatGPT. Vous pouvez également l'essayer :
Adresse : https://colab.research.google.com/drive /1JX1AVIfGtIlnLGqgHrK6WPylPhZvu9qe. ?usp=partage
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!