Utiliser TensorFlow pour créer un modèle de régression logistique, les résultats de la formation sont excellents

Question

Dans TensorFlow, je souhaite créer un modèle de régression logistique avec la fonction de coût suivante : La capture d'écran de l'ensemble de données utilisé est la suivante : Mon code est le suivant : {code...} La capture d'écran du résultat en cours d'exécution est la suivante : Comme vous pouvez le voir, après deux itérations, nous obtenons W et b sont devenus nan, quel est le problème ?

大家讲道理 · Answer

Après quelques recherches, j'ai trouvé le problème.

Dans la phrase sur la sélection de la méthode d'itération :

optimizer = tf.train.GradientDescentOptimizer(0.1)

Vous pouvez vous entraîner normalement ici0.1的学习率过大，导致不知什么原因在损失函数中出现了log(0)的情况，结果导致了损失函数的值为nan，解决方法是减小学习率，比如降到1e-5或者1e-6 J'ai ajusté le taux d'apprentissage à 1e-3 en fonction de ma propre situation, et le programme fonctionne parfaitement.

Ci-joint le résultat final de l'essayage :